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حول المؤلف 
البروفيسور روب كيتشن 


هو باحٿ رئيسي في المجلس الأو رو للبحوث المتقدمة (European Research Council)‏ 
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مجموعة منتقاة من مؤسسات تقديم المشورة. والضغط لكسب التأييدء والتنسيق 
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شكر وتقدير: 

بدآت نشأة هذا الكتاب في أوائل الشهر السابع (يوليو/ آيار) من العام ۲۰٠۲‏ خلال 
مناقشة بمقهى ف أدنيرة مع روبرت روجك (Robert Rojek)‏ من شركة سايج للنشر 
(SAGE)‏ حيث كنت قد اقترحت عليه البحث عن شخص لكتابة مصنف عن OLI‏ 
الكبيرةء والبيانات المفتوحة؛ والبنى التحتية للبيانات» مع تقديم الأفكار وإسداء النصح 
عن ذلك الشخص الذي قد يكون مناسبا لصياغة النص في مثل هذا الموضوع. وكان يرى ف 
auo‏ أنى ذلك الشخص امناسب لتلك ال مهمة. فقررت في وقت «82M‏ بعد مضي عدة coal‏ 
الموافقة بين خطط كتاباق والجمع بينهاء بحيث بدآت في صياغة ما بدا في متناول اليد خلال 
فترة diia)‏ قصيرة جدا ويتناؤل التحليل النقدى لمشهد البيانات المتغير باطراد.تطور الكتاب 
مع مرور الوقت إلى مخطوط كامل يسعى إلى الدراسة المستفيضة للاتجاهات والمناقشات 
Ax UJ!‏ بتأن وإنصاف. وبالتزامن مع «AUS‏ بقي روبرت متانعا e‏ ومصدرا للعديد من 
امواد المثيرة للاهتمام» C555‏ مساعدته موضع تقدير كبير me‏ وق سايج mw‏ ساعد زميله 
كيري ديكنز (Keri Dickens)‏ في الدفع بالكتاب إلى عملية الإنتاج والنشرء التى تم توجيهها 
على نحو مثير للإعجاب من قبل كاثرين هاو (Katherine Haw)‏ 


قام مارتن دودج (Martin Dodge)‏ وتريسي ب. لاوريولت (Tracey P. Lauriault)‏ 
بقراءة مفصلة ونقد هادف للمخطوط بالكامل وعلى نحو متناه ق السلاسة واللطف. alg‏ 
مارك (Mark Boyle) Ly‏ بقراءة كامل المسودة الثانيةء كما قدم غافن مكاردل Gavin)‏ 
gzl 3 (McArdle‏ روبيرت (Evelyn Ruppert)‏ نقدا TW‏ لبعض فصول الكتاب» وإضافة 
لذلك شارك عدد من الزملاء والأصدقاء في مداخلات نافعة ومناقشات مفيدةء حيث دلني العديد 
منهم إلى مواد ذات «&Lo‏ منهم مارك غراهام (Mark Graham)‏ تايلور شيلتون Taylor)‏ 
(Shelton‏ مات زوك (Matt Zook)‏ مات وىلسون (Matt Wilson)‏ لىف مانوفىتش Lev)‏ 
.)Manovich‏ سيان اوكالاهان «(Cian O'Callaghan)‏ سونغ - يوه بيرنج Sung-Yueh)‏ 
bol ghil (Perng‏ كارول (Aileen O'Carroll)‏ جين جرای (Jane Gray)‏ ساندرا كولينز 
«(Sandra Collins)‏ 552 كيتنغ (John Keating)‏ شارون ويب (Sharon Webb)‏ جوستين 
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مهد 


جلسون «(Justin Gleeson)‏ أو یف داولنغ (Aoife Dowling)‏ يوغان مکار Eoghan)‏ 
(McCarthy‏ مارتن تشارلتون ٠ (Martin Charlton)‏ تيم مكار «(Tim McCarthy) à‏ حان 
ریجبی «(Jan Rigby)‏ روب برادشو 5Vl «(Rob Bradshaw)‏ مور (Alan Moore)‏ دراش ماك 
دونشا (Darach Mac Donncha)‏ وجيم .(Jim White) Colg‏ كما تلقيت ;1393 مضدة FAF:‏ 
خلال العروض التقديممية في جامعة دورهام» وجامعة كلارك» وجامعه هارفارد. واهتمت رونا 
برادشوو (Rhona Bradshaw)‏ وأورلا دان (Orla Dunne)‏ بإدارة آعمال المكتب عندما كنت 
أحاول الانكباب على إجراء البحوث وكتابة الفصول. كما تفضلت جوستين جلسيون Justin)‏ 
33 ) بإنتاج بعض الرسوم السانة. فأنا مدين nado oS]‏ بالعرفان. كما أود Lal‏ كن 
الكثير من الناس المشاركين على موقع التواصل الاجتماعي - التويتر وتغريداتهم التي أشارت إلى 
مواد مثيرة للاهتمام: وانخراطهم في مناقشات علمية دقيقة ذات dais ALo‏ الشكر موصول 
إلى كورا (Cora)‏ التي قامت بتشبيتي وقدمت bc‏ رائعا d‏ 

وتم دعم جزء من الأبحاث التي UN‏ في LLS‏ هذا الكتاب من خلال جائزة المجلس 
الأوروبي للبحوث المتقدمة: "المدينة المبرمجة" ERC-2012-AdG-323636; www.nuim.)‏ 
(ie/progcity‏ والتمويل المقدم من هيئة التعليم العالي في برنامج البحوث في المستوى 
الثالث للدورة الخامسة؛ والذي يهدف إلى إنشاء حاوية رقمية لأبرلندا. 

ويمكن الاطلاع على نسخة من مراجع الكتاب من خلال الرابط التالي: http://‏ 
.thedatarevolutionbook.wordpress.com‏ كما يجري بانتظام إضافة مصادر 
للمعلومات وتجارب حول ثورة السانات على الرابط http://www.scoop.it/t/the-‏ 
.programmable-city‏ وبالطبع. فإن التعليقات والردود مرحب بها من خلال البريد 
الإلكترونىي Rob.Kitchingnuim.ie‏ أو التغريد على حساب موقع التواصل الاجتماعي 
robkitchin jog -‏ 


لقد سبق نشر بعض olo Ll‏ الموجودة في هذا الكتاب على شكل أوراق بحثية أو على 
النشرات اليومية» على الرغم من أنه قد تم تحديثهاء وإعادة صياغتهاء والتوسع فيها. ومنها: 
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Table 3.3 is included with the permission of Michael Hausenblas, 
http://5stardata.info/. 

Table 4.1 is reproduced with the permission of The Economist. The Economist 
Newspaper Limited, 

London, issued March 11, 2014. 

Figure 6.1 is reproduced with the permission of Monica Stephens. 

Table 6.1 is reproduced with the permission of Taylor and Francis. 

Figure 6.2 is reproduced with the permission of Flightradar24.com. 

Figure 6.3 is reproduced with the permission of Andrew Hudson-Smith. 
Figures 6.4 and 6.5 are reproduced with the permission of Professor Mikael 
Jern, National Center for 

Visual Analytics, Linköping University, http://ncva.itn.liu.se. 

Table 7.1 Forms of big data corporate intelligence is included with the 
permission of McKinsey & 

Company. 

Table 7.2 and Figure 7.1 are reproduced courtesy of International Business 
Machines Corporation, © 

International Business Machines Corporation. 

Figure 7.2 is reproduced from http://ipprio.rio.rj.gov.br/centro-de-operacoes- 
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ملاحظة: 

يعبر عن مصطلح البيانات (Data)‏ في هذا الكتاب في صيغة الجمع» مع استخدام 
مصطلح وحدة بان UYU (Datum)‏ على اطثل ا مفرد (Singular Instance)‏ بحسب ما 
هو موضح في قاموس أوكسفورد للغة الانجليزية (Oxford English Dictionary- OED)‏ 

في اللغة اللاتينيةء البيانات هي صيغة جمع لكلمة بيانء وتاريخيا وف المجالات العلمية 
المتخصصة. على الخصوص.ء يتم التعامل ايضا مع مصطلح «البيانات» للدلالة على الجمع 
في اللغة الإنجليزية. حيث b‏ في سياق فعل الجمع (were)‏ كما في »3 gaz‏ البيانات 
وتصنيفيا». 

ومع ذلك» يستخدم هذا المصطلح على نحو متزايد في صيغهة ال مفرد في وسائل الإعلام 
العامة وال محادثة اليومية» كما جرى تفصيل ذلك ف قاموس أوكسفورد للغة الإنجليزية: 


ومع à «aL Js‏ العموم لا يجري التعامل مع مصطلح d zua «bL UI»‏ الجمع E‏ 
الاستخدام غير العلمي الحديث. ولكن بدلا من US‏ يجرى التعامل معه كاسم إجمالي - 
للبند غير المعدود - على غرار كلمة «معلومات»» التي تأخذ الفعل بصيغة المفرد. وأصبح 
من امقبول à‏ اللغه الانحليزية القياسسية على مدى عدد من السنوات وعلى نطاق واسع 
الحمل من deas‏ «تم جمع SL. à «bL UI‏ فعل ]5,5 «Was»‏ 

لذاء يتبع هذا الكتاب الاصطلاح العلمي امعمول به. ومع ذلك» تم إبقاء النص على all>‏ 
حيثما اتفق ورود استخدامه بصيغة المفرد عند الاقتباس. ودون الجدل في أي الصيغتين هو 
الأصح» فإن انحاز النحاة هو لصغه فعل الجمع: ولكن الاستخدام العام الشائع هو 1 
انفتاحا ومرونه. 
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do Ao 

هناك تاريخ طويل للحكومات» والأعمالء والعلوم: والمواطنين فيما يتعلق بإنتاج واستخدام 
البيانات من أجل رصد العام وتنظيمهء والانتفاع os nba. n E Moos dia‏ مقف ilis‏ 
كانت البيانات في العادة مكلفة وتستغرق وقتا طويلا في الإنتاج والتحليل والتفسير وتوفر في 
esas‏ صورة «Ab‏ غالا مشوشة»ء 45529 عن الظاهرة قد الدراسة. ونظرا للندرة النسسية 
كانت السانات ذات الجودة العالىة سلعة ذات das‏ وعلى هذا الأساس كان التكتم الشديد 
والحرص عليها وتداولها وتبادلها بأثمان باهظة. ولكن هذا الوضع بدأ يتغير بشكل جذري 
تماما. فالبيانات لم تفقد شيئاً من قیمتهاء ولكن جرى في نواح أخرى تحول في طبيعتها 
وطرق انتاجها من خلال مجموعة ما وصفها )1997( Christensen‏ بالابتكارات AS Ll‏ 
ilg‏ شكلت b asd‏ للوضع الراهن في كيفية إنتاج البيانات وإداراتها وتحليلها وتخزينها 
والاستفادة منها. فيدلا من أن تكون السانات نادرة ومحدودة à‏ قدرة å‏ الوصول dy!‏ غدت 
على نحو متزايد طرق إنتاج البيانات كالطوفان؛ سيلا عميقا وواستعا من البيانات المتنوعة 
x à‏ واطمرتشطة las‏ وامتوافرة عند الحاجة إليها في الوقت ال مناسب. وال منخفضة 
قينا في التكلفة. وخارج نطاق الأعمال في طبيعتهاء مع تنامي فتحها وازدياد قابلية وسهولة 
الوصول إليها. فثورة البيانات جارية في الوقت الراهن» وهي تعمل بالفعل على إعادة 
تشكيل كيفية إنتاج اممعرفةء وإجراء الأعمال» وحوكمة التشريعات والقوانين. 

لقد تأسست هذه الثورة في الموجة الأخيرة من تقنيات المعلومات والاتصالات (ICTs)‏ 
وذلك من خلال عدد كبير من الأجهزة الرقمية التي نصادفها اليوم في المنازلء وأماكن 
العملء والأماكن العامة؛ كأجهزة الاتصال المحمولة: والحوسبة الموزعةء والحوسية السحابة؛ 
ووسائل التواصل الاجتماعي؛ وإنترنت الأشياء (أجهزة ووسائل استشعار مترابطة ومتصلة 
من خلال الشبكة العالية -الإنترنت). فهذه الوسائط وال منصات التقنية الجديدة أضحت 
تقود وتوجه أكثر من أي وقت مضى المزيد من جوانب الحباة ege‏ - العملء casta‏ 
والسفرء والاتصال» والترفيه - وأضحت العوامم التي نعيش فيها تفهم بهيئة بيانات وتسير 
من خلال التقنبات المعتمدة على bU UI‏ وعلاوة على US‏ فان هذه الوسائط والمنصات 
التقنبه الجديدة تعمل ماديا Laitas‏ على إعادة تشكيل طرق «e U3]‏ وتداول» وتفسير 
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البيانات» وإنتاج ما اصطلح على تسميته «البيانات الكبيرة «Big data‏ حيث كميات هائلة 
من البيانات الرقمية المتغيرة cde giblo‏ والتي من السهولة بمكن الجمع بينهاء وتبادلهاء 
وتوزيعها من خلال شبكات تقنية ال معلومات والاتصالات» وتحليلها بواسطة جيل جديد من 
أساليب تحليل البيانات (Data Analytics)‏ معدة لتتلاءم مع وفرة البيانات على العكس 
من ندرة البيانات المعتادة. ويتضح حجم طوفان البيانات الناشئة من خلال الادعاء بأنه 
"من فجر الحضارة وحتى العام ٠‏ أنتجت البشرية خمسة إكسا (Exabyte) cob‏ 
من المعلومات فقط؛ في حين نحن بصدد إنشاء القدر نفسه من البيانات كل يومين" Hal)‏ 
,Varian, chief economist with Google‏ مقس من 2012 .(Smolan and Erwitt‏ 

ولا تعد البيانات الكبيرة المكون الوحيد 3593 البيانات» فبالأحرى كان هناك العديد 
من المبادرات المتصلة بعضها ببعض من قبيل التحول الرقمي (Digitization)‏ ربط 
وتوسيع مجموعات البيانات المنتجة تقليديا (البيانات الصغيرة) مع بعضها عبر بنى تحتية 
شبكية؛ وحركة البيانات المفتوحة التي تسعى لجعل أكبر قذر ممكن من البيانات متوفرة 
بشكل مفتوح للجميع للاستخذام؛ والهياكل المؤسسية الجديدة التي تسعى لتأمين المبادئ 
التوجيهية والسياسات المشتركة فيما يتعلق بأنماط تنسيق البيانات» ونماذج هيكلتهاء 
والبيانات الوصفية عنهاء وحقوق الملكية الفكرية»ء وتراخيص الاستخدام القانوني dy‏ ومعايير 
المشاركة بها. وتشكل هذه المبادرات مجتمعة مجموعة من مجاميع البيانات الجديدة 
- مزيج من نظم الفكرء وأشكال ال معرفة: والتمويلء والاقتصادات السياسية»ء والتشريعات 
الحاكمة والجوانب القانونية وامادية الناظمة» والبنى التحتية: وا ممارسات. والمنظمات 
وا مؤسسات» والمجتمعات المحلية والشخصيات الاعتبارية» والأماكن: والأسواق - التي تؤطر 
لكيفية إنتاج البيانات والحدود القصوى لاستخداماتها الممكنة. 

ويظهر أثر البيانات الكبيرة» والبيانات ال مفتوحة: والبنى التحتية للبيانات بشكل جلي 
في مجالات العلوم» وقطاع الأعمالء والقطاع الحكوميء والمجتمع المدن. فالتخصصات 
الجديدة التي تم استحداثها بدأت الآن بالتعامل مع تدفق البيانات الهائل بعد التعود 
على العمل في جزر البيانات المتفرقة. والسعي نحو استخراج المعلومات» واستخلاص النتائج 
من عدد قليل نسسا من المشاهدات )2010 (H.J. Miller‏ وقد اقترنت هذه التخصصات 
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مجالات جديدة. مثل علوم البيانات (Data Science)‏ والحوسبة الاجتماعية Social)‏ 
28 ) والعلوم الإنسانية الرقمية (Digital Humanities)‏ والعلوم الاجتماعية 
الحاسوبية (Computational Social Sciences)‏ والتي تعنى JS o‏ واضح ببناء البنى 
التحتية للبيانات وإيجاد طرق مبتكرة لتحليل وفهم معنى البيانات عند توسعها وكبر 
حجمها. ففي قطاع الأعمال» توفر البيانات الكبيرة وسائل جديدة لإدارة جميع مناحي 
أنشطة الشركة بصورة مرنة وفعالة ويستفاد منها لتحقيق أرباح إضافية من خلال تعزيز 
الإنتاجيةء والقدرة التنافسية. وال معرفة بالسوق. كما أضحت السانات نفسها سلعة «dal‏ 
يتم شراؤها وبيعها مرارا في السوق العامية مليارات الدولارات. وبالنسبة للحكومات» وعلى 
نطاق واسع. توفر البيانات الديناميكية المتغيرة رؤى جديدة حول عملياتها. فضلا عن 
إعادة تشكيل وسائل الحكم وتنظيم المجتمع. فمن خلال تفحص قواعد البيانات المفتوحة, 
يستخلص اللمواطنون والمنظمات غير الحكومية (NGOs)‏ النتائج الخاصة بهم» متحدين 
المنظمات التجارية الربحية والأجندات الحكومية» ويقدمون رؤى بديلة للكيفية التي 
ينبغي بها تنظيم مجتمع وإدارته. 

لقد أثارت هذه الفرص الجديدة طفرة حقيقية ملموسة في ما يمكن تسميته ب "تعزيز 
السيانات" «(Data Boosterism)‏ من خلال حشد الدعوات امبشرة بفوائد وافاق bL!‏ 
الكبيرة: والبيانات المفتوحة: والبيانات الصغيرة الموسعة. والبتعض من هذه الدعوات له 
ما يبرره» وبعضها الآخر مجرد غث وتهويل دعاق لا حقيقة له البتة. في DELI‏ أصبحت 
مصطلحات: البيانات الكبيرة والبيانات المفتوحة: أنماطا ثقافية قوية في الانتشار والتأثير 
(Memes- clas)‏ وليست مجرد وسيلة لوصف السانات ولكنها رمز لخطاب أوسع مدى 
يستخدم في حشد الدعم لها وانتشار اعتمادها والبدء في تطبيقها. فمع هذا الترويج 
والتعزيز أضحى من السهل الانجراف نحو تبني هذه ال مصطلحات دون انتقاد أو تمحيص 
للتغيرات التي تحدث والتى أثار العديد منها مخاوف ASMI‏ ومحاذير سياسية وقانونية. 
ورغم ذلك» فقد كشف التاريخ فيما مضى عن سوابق من الابتكارات المربكة المتعلقة 
با معلومات - على سبيل JELI‏ التحول الجذري ف إنتاج المعرفة في أعقاب اختراع الطابعة. 
ومن حيث الواقع» فقد صاحب بداية كل pas‏ جديد من العلم تقنيات جديدة أدت إلى 
زيادة مفرطة ف البيانات وكانت بمثابة شرارة التحول نحو طرق جديدة gloy‏ وتنظيم: 
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5293(« وتحليل» وتفسر السيانات )2000 .(Darnton‏ على سبيل «JUL‏ من ملاحظات 
(Strasser 2012)‏ فإن الاستكشافات في aJ! pac‏ والتى تعززت بفعل آدوات duale‏ 
أفضل في الملاحة. ورسم الخرائطء قد أسفرت عن كميات هائلة من الاكتشافات الجديدة 
التي أدت إلى وسائل جديدة للتصنيف» وتقنيات جديدة في التحليل والتخزين: وأفكار 
علميه جديدة. 

ونظرا للمرحلة المبكرة نسبيا في ثورة البيانات الحالية» فإنه ليس من المؤكد تماما كيف 
ستتكشف وتستقر التحولات الحالية: وما الذي سيكون عليه نطاق عواقب التغيرات التي 
تحدث من منظور أوسع. فالواضح هو أن هناك حاجة ملحة لمحاولة الإدراك والشعور Le‏ 
يحدث. وهكذاء فإن الهدف من هذا الكتاب هو تقديم إجمال» وتحليل مبدني ودقيق 
انات 116555 1 21 الهارية خالا فهذا الان يسعى: Ra‏ یی الظرق 
والوسائل المتعلقة بإعادة تشكيل إنتاج ومعالجة وتحليل وتبادل البيانات» وما يعنيه هذا 
لكيفية إنتاج واستخذام ال معلومات وال معرفة؛ وهو من جهة أخرى مهد للنقاش والتفكير 
النقدي حول البيانات: طبيعتهاء وكيفية تأطيرها من النواحي الفنية والفلسفية والأخلاقية 
والاقتصادية والتجميعات التقنية والمؤسسية ال محيطة بها. وبدلا من أن تتحدد فوائد 
البيانات !)8545( والبيانات ال مفتوحة» والبنى التحتية للبيانات من خلال حالة عاطفية: أو 
نقد لاذع يشجب نتائج العواقب الأكثر سلبية da)‏ يقدم الكتاب تقييما نقديا موضوعيا 
للتغييرات التي تحدث. 

ويستند التحليل المقدم في هذا الكتاب على مشاركة واسعة النطاق مما سبقه من 
مؤلفات في مختلف العلوم, والعلوم الإنسانية» والعلوم الاجتماعية. ومن مطبوعات الثقافة 
الشعبية» والإصدارات الصحافية. والدوريات الصناعية» وعلى خبرة مباشرة (à‏ العمل على 
أنظمة حفظ أرشفة وبنى تحتية ومشاريع تحليلات OBL‏ على نطاق مؤسسي واسع. 
وينقسم الكتاب إلى أحد عشر فصلا. يقدم الفصل الأول لمحة عامة ونقدا فكريا حول 
مفهوم البيانات وكيفية فهم قواعد البيانات والبنى التحتية للبيانات. ويبحث الفصل 
الثاني في الدور المستمر للبيانات الصغيرة والكيفية التي تم بها توسيع نطاقها إلى أرشيفات/ 
محفوظات رقمية وبنى تحتية» إلى أن وصلت إلى درجة التداول وبيعها من خلال وسطاء 
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البيانات. كما يناقش الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة 
والبيانات المرتبطة التي يجري تقاسمها ومشاركتها وإعادة استخدامها على نطاق أوسع 
مرور الوقت. ويبين الفصلان الرابع والخامس طبيعة البيانات الكبيرة بالتفصيل وعوامل 
التمكين للبيانات الكبيرة ومصادرها المساعدة على انتشارهاء في حين ead‏ الفصل السادس 
dale dah‏ عن مجموعة جديدة من تحليلات البيانات التي ترمي إلى فهم البيانات الصغيرة 
الموسعة والبيانات الكبيرة. كما يدرس الفصلان التاليان (السابع والثامن) الحجج ال مستخدمة 
لتعزيز البيانات الكبيرة والترويج لها وبيان تأثيرها في الحوكمة والأعمالء والسبل التي تقوم 
بها ثورة البيانات على إعادة تشكيل LAS‏ تصور البحوث وممارستها. ويناقش الفصلان 
التاسع والعاشر التحديات التقنية والتنظيمية» والأخلاقيةء والسياسية. والقانونية لثورة 
البيانات. ويحدد الفصل الأخير بعض الاستنتاجات الكلية ويقدم خارطة طريق لإجراء 
ا مزيد من البحث والتاصيل. 
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الفصل الأول 
تصور لمفهوم البيانات (Conceptualising Data)‏ 


يتم فهم البيانات عادة على أنها المادة الخام التي تنتجها طرق تجريد العوامم من حولنا 
والتعبير عنها من خلال فئات» ومقاييس» وأشكال تمثيلية أخرى - كالأرقام» والحروف. 
والرموزء والصورء والأصوات» والموجات الكهرومغناطيسية» والثنائية الرقمية - تشكل اللبنات 
الأساسية في «Lo‏ صروح ال معلومات وا معرفة. ومع أن البيانات تعد بطريعتها معيرة وممذلة 
للأشياء (على سسيل JELI‏ القياسات المتعلقة بظاهرة ما كعمر الشخصء Aob‏ 4359« لونهء 
ضغط دة doy‏ ا8زو مان إقامتة. وما إلى ذلك): إلا ]25 جه[ ان تكون أيضا 
ضمنية (من خلال/الغياب بدلا من الوجود). أو مُشتقة عاق سبيل المثالالبيانات التي يتم 
إنتاجها من البيانات الأخرى كالنسبة المئوية للتغير مع مرور الوقت والتي يتم احتسابها 
من خلال مقارنة البيانات من فترتين زمنيتين مختلفتينء ويمكن أن تكون البيانات مسجلة 
ومخزنة إما في شكل تناظري (Analog)‏ أو من خلال ترميزها في شكل رقمي كأرقام ثنائية 
.(Bits)‏ وتتصف البيانات بأنها ذات جودة جيدة إذا كانت منفصلة وواضحة معنى أن 
تكون كل وحدة بيان (Datum)‏ 62,25( ومستقلة وقابلة للانفصال. ومعرفة «Quels JS o‏ 
وتراكمية قابلة للحصر (يمكن أن تبنى في (Cole saos‏ ومرتبطة ببيانات وصفية لها (بيانات 
عن البيانات)ء ويمكن ربطها مجموعات بيانات أخرى لتقديم رؤى وأفكار غير متوفرة من 
مجموعة بيانات واحدة )2013 (Rosenberg‏ وتتمتع البيانات باستخدام قوي وقيمة 
عالية كونها توفر ال مدخلات الأساسية لكافة مراحل التحليل التي يجري توظيفها من قبل 
الأفراد. والمؤسسات. وقطاعات العلوم والأعمال لفهم وتفسير العام الذي نعيش 443« والتى 
تستخده بدورها لاستحداث الابتكارات» اممنتحات» السياسات؛ واطعارف التى تشكل الكيفية 
التي يعيش بها الناس حياتهم. 

ومن هناء de‏ البيانات موردا رئيسيا ف pai‏ الحديث. ومع ذلك ونظرا لفائدتها 
وقيمتهاء ومقدار الجهد والموارد المخصصه لإنتاجها وتحليلهاء فمن اللافت للنظر كيف تم 
إيلاء القليل من الاهتمام للتصور ال مفاهيمي والإدراك aul‏ للبيانات في حد ذاتهاء وف 
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الفصل الأول 


المقابل» هناك الآلاف من المقالات والكتب المكرسة لفلسفة ال معلومات وا معرفة. فكما أننا 
نميل في العادة للتركيز على المباني والأحياء عندما ننظر إلى المدن: بدلا من الطوب والإسمنت 
المستخده في بنائهاء فكذلك هو الحال مع البيانات. وعلاوة على ذلك» وبالمثلء كما اعتدنا 
التفكير بالطوب والإسمنت بصفتها مجرد وحدات بنيوية بدلا من عناصر تم تصنيعها داخل 
gila‏ من قبل شركات ملزمة ضمن اعتبارات لوجستية ومالية وقانونية» وآنه يتم توزيعهاء 
وتخزينهاء وتداولهاء كذلك حالنا إلى حد كبير في التعامل مع البيانات. ونتيجة لذلك» وعندما 
تكون البيانات هي محور التساؤل والاهتمام» عادة ما يتم النظرء باممعنى التقني إلى حد 
كبير» إلى الكيفية التي ينبغي بها إنتاج وتحليل البيانات» أو الكيفية التي يمكن بها الاستفادة 
منها في إنتاج رؤى وقيم» وليس زيادة النظر في طبيعة البيانات من منظور مفاهيمي 
وفلسفي. 

ومع الأخذ بهذه dae Mol‏ في الاعتبارء فإن الهدف الرئيسي من هذا الكتاب هو مركب 
ثلاني الأبعاد. فيه: توفير شرح تفصيلي عن طبيعة البيانات ومجاميعها على نطاق أوسع؛ 
وإيضاح الكيفية التي تتحول فيها هذه المجاميع وتتحور مع تطوير بنى تحتية جديدة 
للبيانات» والبيانات المفتوحة» والبيانات الكبيرة؛ والتفكير المعمق ف الآثار المترتبة عن هذه 
المجاميع الجديدة للبيانات فيما يتعلق بكيفية استشعار العام المحيط بنا والتعاطي معه. 
ولتوفير منهاج مفاهيمي وتصور ose‏ أولي» سيتم في هذا الفصل فحص أنماط البيانات 
وأطرهاء وطبيعتهاء والقواعد الفلسفية لها بالتفصيل. وبعيدا عن كونها وخدات بنيوية 
d SUL CA LASS dia uo‏ عق أن I ais 351 A‏ مها كنا B3‏ ففي حين يقبل 
العديد من المحللين البيانات على ظاهرهاء ويعاملونها كما لو أنها محايدة وموضوعية 
وقابلة مسبقا للتخمين والتحليل في طبيعتهاء إلا أن البيانات مؤطرة في الواقع من الناحية 
الفنية. والأخلاقيةء والاقتصادية: والزمانيةء والمكانية: والفلسفية. فالسانات لا مكن أن 
توجد بشكل مستقل عن الأفكارء والأدوات» وال ممارسات» والسباقات» وال معارف المستخدمة 
لانتاحهاء ومعالجتهاء وتحلبلها )2013 diJa .(Bowker 2005; Gitelman and Jackson‏ 
فإن الحُجة المقدمة هي أن فهم البيانات وثورة البيانات الجارية Ule‏ يتطلب تحليلا أكثر 
دقة من ذلك الذي تستعرضه الكثير من الأدبيات ذات الصلة بالبيانات المفتوحة والبيانات 
الكبيرة في وقتنا الحاضر. 
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تصور لمفهوم البيانات 


ماهية السانات: 
بشكل اشتقاقي» فإن كلمة البيانات «Data»‏ مشتقة من الكلمة اللاتينية «Dare»‏ 
التي تعني «أن تعطي». وبهذا ال معنی» فإن البيانات هي عناصر خام يمكن استخراجها من 
أو تعطى بواسطة ظاهرة معينة يجري قياسها وتسجيلها بطرق مختلفة. ولكن البيانات 
تشير في الاستخدام العام إلى تلك العناصر التي تؤخذ وتستخرج من خلال الملاحظات: 
والحسابات» والتجارب» وحفظ السحلات )2007 Ul .(Borgman‏ من الناحية الفنية: 
فما نفهمه من بانات lpi‏ في الواقع التقاطات «Capta»‏ والمشتقة من الكلمة اللاتينية 
«Capere»‏ والتي تعني «الأخذ»؛ أي تلك الوحدات من البيانات التي تم اختيارها 
وانتقاؤها من gaxo‏ £ كل البيانات ال محتملة )2011 .(Kitchin and Dodge‏ كما قال 
,ix :1950)‏ مقس من Becker 1952: 278) Jensen‏ : 
كان حادثا T‏ في التاريخ أن يستخدم المصطلح بیان «Datum»‏ بدلا من 
مصطلح لقطة IYU «Captum»‏ على وصف وحدة الظاهرة ني العلوم. وهی 
ليست المناولات العلمية التي منحتها الطبيعة «els‏ ولكن ال مناولات التي أخذت 
أو انتقيت من الطبيعة من قبل العالم نفسه وفقا لهدفه. 
من ثم. وبا معنى الدقيق للكلمة: ينبغي على الكتاب أن يعنون بثورة اللقطة 
.«The Capta Revolution»‏ ومع «US‏ ولأن مصطلح البيانات «Data»‏ قد أصبح 
متأضلا في لغة الاستخدام الأكادمي وقطاع الأعمال لتعنى اللقطة Jug «Capta»‏ 
من الخلط واللغط أكثر في هذه المسألة فمن المنطقي المتابعة والاستمرار في استخدام 
مصطلح البيانات «Data»‏ مع أن اعتماد مصطلح اللقطة «Capta»‏ أكثر ملاتمة في 
الاستخدام. وبعد تجاوز تسليط الضوء على جذور الاشتقاق اللغوى لهذا المصطلح 
فإن هذه المناقشة الوجيزة تبدأ في تسليط الضوء على أن البيانات التي يتم جمعها 
من خلال القياس هي de gl Ll»‏ منتقاة من مجموع كل البيانات امحتملة - 
والتى اخترنا التقاطها من كل ال معطيات ال ممكنة. وعلى هذا النحوء تكون البيانات 
جزئية بطبيعتهاء انتقائية» وممثلة. مع أهمية المعايير المميزة المستخدمة ف التقاطها. 
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الفصل الأول 


وقد لاحظ علماء آخرون أن ما تم فهمه على أنه «البيانات» قد تغير مع مرور الزمن 
وتطور العلم. فقد بين )2013 (Rosenberg‏ بأن مصطلح «البيانات» استخدم لأول مرة 
باللغة الإنجليزية في القرن السابع عشر. وارتبط كمفهوم إلى حد كبير بالحداثة والنمو 
والتطور المصاحب للعلوم» والطرق الجديدة في إنتاج» وعرض» ومناقشه امعرفه في القرنين 
السابع عشر والثامن عشر والتي انتقلت بعيدا عن اللاهوت» Begla‏ والعواطف إلى 
الحقائق والأدلة واختبار النظرية من خلال التجربة ;2013 (Poovey 1998; Garvey‏ 
Rosenberg 2013)‏ ومع مرور الوقت. جاء فهم السانات على lal‏ سابقة للتحليلء 
وهي ما قبل اتخاذ صفة الواقعية. وتختلف في طبيعتها عن الحقائقء والآدلة: وا معلومات. 
وا معرفةء ولكنها عنصر مؤسس في تكوين جميع هذه العناصر على الرغم» في الغالب» من 
اختلاط التعاريف وال مصطلحات المستخدمة في وصف البيانات» الحقائقء الأدلةء «dà ys Al‏ 
وامعلومات بحسب ما أشار (Rosenberg 2013: 18) aJl‏ حين ذكر òl‏ 


الحقائق وجودية (Ontological)‏ والأدلة معرفبة (Epistemology)‏ 

والسانات بلاغية .(Rhetorical)‏ وتكون وحدة السان «Datum»‏ حقيقة mu‏ 

كما قد تكون الحقيقة في واقع الأمر Ma‏ على أن وجود وحدة السان «Datum»‏ 

يعد مستقلا دون أي اعتبار للحقيقة الوجودية امطقابلة Corresponding)‏ 

.(Ontological Truth‏ وعند نفي الحقيقة وإثبات عدم صحتهاء فإنها تتوقف 

عن كونها حقيقة. فالبيانات الكاذبة هي بيانات مع ذلك. 

وبحسب ال مصطلحات/التعابير البلاغية» فالبيانات هي تلك التي توجد قبل النقاش أو 
التفسير الذي بحولها إلى حقائق» Alg‏ ومعلومات )2013 .(Rosenberg‏ ومن هذا المنظور 
تحمل البيانات مفاهيم مميزة: فهي تكون بذلك مجردةء ومنفصلة» وتراكمية (يممكن الجمع 
(Rosenberg 2013) (yus‏ وذات معنى مستقل عن «sls Mäll‏ وامنتج لهاء والساق 
(معنى» أن تحمل البيانات معناها سواء تم تخزينها بصورة تناظرية (Analog)‏ أو رقمية 
(Digital)‏ أو تم عرضها على الورق أو الشاشة أو تم التعبير عنها cds) dob‏ أو تم تقييدها 
blet‏ محددة غير متغيرة» مثل إشارة عدد الحلقات في جذوع الأشجار لعمر الشجرة والذي 
يكون .(Floridi 2010) (4 TOR lass‏ ويؤكد )2008 ol (Floridi‏ دعم استقلال السانات 
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تصور لمفهوم البيانات 


قائم على 453b‏ أنواع من الحياديه هى: التصنيفية (Taxonmic)‏ كون البيانات تمثل كانات 
علائقة معرفه Nusa‏ بالنسبة إلى سانات خاصة أخرى؛ والطوبوغرافية (Typological)‏ 
لأنه مكن للبيانات اتخاذ أشكال مختلفة منفصلة بعضها عن بعضء على سبيل «JULI‏ 
الشكل الأساسيء الثانوي» الوصفيء التشغيليء والمشتق؛ والجينية (Genetic)‏ كون البيانات 
تمتلك دلالات مستقلة عن مدى فهمهاء فعلى سبيل «JULI‏ تشكل الهيروغليفية على حجر 
الرشيد بيانات بغض النظر عن حقيقة أنه عند اكتشافه b‏ يمكن لأحد أن يفسرها. 

وفي واقع الأمر ليس كل من يفكر أو يشتغل بالبيانات يحمل هذه النظرة البلاغية 
الضيقة. ففهم البيانات لم يتطور مع مرور الوقت فحسب» بل اختلف هذا الفهم بحسب 
منظور الفهم ووجهة النظر للبيانات. على سبيل JUL‏ أوضح )2008 (Floridi‏ أن البيانات 
من المنظور المعرفي هي مجموعات من الحقائق» ومن المنظور المعلوماني البيانات هي 
معلومات» ومن منظور الحوسبة التقنية البيانات هي مجموعات من العناصر الثنائية التي 
يمكن معالجتها ونقلها إلكترونياء ومن المنظور العام (Diaphoric)‏ البيانات هي عناصر 
مجردة بتميز واضح وملموس من البيانات الأخرىء ففي الحالة الأولى» توفر البيانات الأساس 
مزيد من الاستدلال أو تشكل الأدلة التجريبية. وف المجموعة الثانيةء تشكل البيانات 
معلومات تمثيلية /ممثلة ممكن تخزينها ومعالجتها وتحليلهاء ولكن لا تشكل بالضرورة 
حقائق. أما في المجموعة AILI‏ فتشكل البيانات المدخلات والمخرجات من الحوسبة ولكن 
ينبغي معالجتها لتحويلها إلى حقائق ومعلومات على سبيل JALI‏ يحتوي القرص الرقمي 
المدمج (DVD)‏ على غيغابايت من البيانات» وهي ليست وقائع أو معلومات بحد ذاتها 
(فلوريديء 0* ((Y*‏ ف المنظور qul JI‏ تكون البيانات ذات مغزى لأنها التقاط ودلالة على 
التنوع والتغيير على سبيل JELI‏ أنماط من blä‏ والحروف الأبجدية والأرقام: والموجات 
الطولية التي تقدم إشارة مكن تفسيرها. وكما هو مبين أدناهء قد يشمل فهم البيانات 
مناظير أخرى مثل الفهم القائم على اعتبار النناثاث so‏ اجتماعياء أو امتلاك النبانات وجودا 
يبنا أو تحميلها مضامين إيديولوجية: أو اعتبارها delw‏ يتم تداولها الاتجار بهاء أو أنها 
تشكل منفعة dole‏ وغير ذلك من المفاهيم الموجودة. والنقطة الأساسية هناء أن السانات 
4 تكن أبدا ببساطة مجدد بيانات. حيث تختلف الكيفية التي يتم فيها تصور البيانات 
واستخدامها من قبل أولئك الذين يجمعون. ويحللون» ويستخلصون النتائج منها. 
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أنواع السيانات: 

سواء كانت البيانات بطبيعتها قابلة للتخمين (تم التكهن قبل التحقق منها) ومطابقة 
بلاغيا أو لاء فمن الواضح أن البيانات متنوعة في خصائصهاء مما يحدّد بعبارات واضحة 
كيفية التعامل معها وما يمكن القيام به من خلالها. وبصفة «dale‏ تختلف البيانات بحسب 
النموذج (النوعي el‏ الكمّي)»: والهيكل (المنظم» أو شبه المنظم» أو الغير منظم)ء وا مصدر 
(مسجلة: أم مشتقةء el‏ مستنفذة: أم عابرة)» والمنتج (رئيسي, أو ثانوي» أو (ele‏ والنوع 
(بيانات تأشريةء أو بيانات خاصية» أو بيانات وصفية). 


السانات الكمية (Quantitative Data)‏ والسانات النوعية (Qualitative Data)‏ : 
من الممكن أن تتخذ البيانات العديد من الأشكال المادية متضمنا ذلك الأزقاة: والنصوص, 
والرموزء والصورء والصوت,. والموجات الكهرومغناطيسية» أو حتى الفراغ sl‏ الصمت (فالفضاء 
الفارغ :هو ف حَدَّاذاته بيانات). وتتقسم هذه البيانات ف العادة إلى فئتين رئيسيتين: 
البيانات الكمية والبيانات النوعية. فالبيانات الكمية تتكون من سجلات cda)‏ وبشكل عام 
تكون هذه البيانات واسعة النطاق وتتعلق بالخصائص الفيزيائية للظواهر (مثل Johl‏ 
الارتفاع» ا مسافة: الوزنء» ám Lll‏ والحجم). أو تكون تمثيلية وتتعلق بالخصائص غير المادية 
للظواهر (مثل الطبقة الاجتماعية. المستوى التعليميء الخرمان الاجتماعي» وتضنيفات 
مستوى المعيشة). وللبيانات الكمية أربعة مستويات مختلفة للقياس والتي تحدد LAS‏ 
معالحتها وتحلىلها )1999 Kitchin and Tate‏ وانظر La]‏ الحدول .)١1-١‏ ومكن تحليل 
هذه البيانات باستخدام العروض اطرئية» ومجموعة متنوعة من طرق الإحصاء الوصفى 
والاستدلالي» وتستخدم باعتبارها مدخلات للنماذج التنبؤية ونماذج المحاكاة. 
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)١-١( الحدول‎ 


مستويات قياس البيانات 


البيانات الاسمية فئوية بطبيعتهاء مع تسجيل المشاهدات 
(Nominal data)‏ في وحدات قياس منفصلة. 


ترتب المشاهدات في dahi OUS‏ حيث 

بعض المشاهدات هي أكبر من غيرها. 

تمتد القياسات على طول مقياس يتضمن درجة الحرارة 
الفترة sl‏ المسافة بين نقطة أصل ثابته | على المقياس المئوى 
وأخرى متغيرة. ولا تتغير طبيعة فترة 
olus LZ‏ ق هذا النوع من القياسات 
عند الإضافة أو المضاعفة مقدار ثابت. 
ويمكن أن تكون قيمة البيانات متصلة 
(على سبيل JULI‏ الوقت أو الطول) أو 
منفصلة /متقطعة (على سيل «JULI‏ عدد 
مرات المشاهدة) في الطبيعة. 





السانات النظامية الترتسة 
(Ordinal data)‏ 


بيانات الفترة (أو المسافة) 
(Interval data)‏ 


(Celsius scale) 





البيانات النسسبيه 
(Ratio data)‏ 


مماثلة لسانات الفترة عدا أنها ذات 
نقطه اصل صفرية حقيقية: كما ان 
المضاعفة بمقدار ثابت لن تغير الطبيعة 
النسية للمشاهدة. 

وقي امقابل. فإن البيانات النوعيه هي بيانات غير عددية» مثل النصوص, الصورء الفنء 
الفيديوء الأصوات» والموسيقا. وبرغم أنه يمكن تحويل البيانات النوعية إلى بيانات AaS‏ 
VI‏ أن ذلك يتضمن خفضا وتجريدا كبيرين وخسارة eld‏ البيانات الأصلية نتيجة لعملية 
التحويل. ولذاء فإن عملية تحليل البيانات النوعية تمارس ف العادة على المواد الأصلية» سعيا 
لاستخلاص وبناء المعنى والفهم بدلا من إخضاع البيانات ومجرد إمرارها لتقنيات حاسوبية. 
ومع ذلك» فقد تم إحراز تقدّم كبير فيما يتعلق بمعالجة وتحليل البيانات النوعية حاسوبيا 
من خلال عدد من التقنيات Jia‏ التعلم JYI‏ والتنقيب في البيانات (انظر الفصل السادس). 






dole‏ الاختبار على مقباس 
من صفر-١٠٠‏ 
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السانات المنظمة (Structured Data)‏ والسانات غير المنظمة (Unstructured Data)‏ 
والسيانات الشبه المنظمة :(Semi-structured Data)‏ 

البيانات ا منظمة هي تلك البيانات التي يمكن تنظيمهاء وتخزينهاء ونقلها بسهولة من خلال 
نموذج بيانات محدد» مثل قائمة الأرقام والنصوص الواردة في جدول أو قاعدة بيانات علائقية 
ذات تنسيق ثابت موحد (على سبيل JELI‏ الاسم. تاريخ ILLI‏ العنوان»ء الجنس.... إلخ). 
ويمكن معالجة هذه البيانات» والبحث فيهاء والاستعلام عنهاء والجمع بينهاء وتحليلها بشكل 
مباشر نسبياً باستخدام حساب التفاضل والتكامل والخوارزميات» كما مكن تمثيلها صوريا 
باستخدام أشكال مختلفة من الرسومات البيانية والخرائطء ومعالجتها بسهولة من قبل 
أجهزة الحاسب الآلي. أما البيانات الشبه المنظمة فهي بيانات ذات تنظيم/ هيكل فضفاض 
وليس لها نموذج أو مخطط مسبقء ومن ثم لا يمكن تقييدها ضمن قاعدة بيانات علائقية. 
وتكون بنية البيانات الشبه المنظمة غير متسقة» وضمنية» ومرنة»وغالبا ما تتداخل في 
شبكة ذات شكل هرمى» ولكنها في ذات الوقت تتمتع مجموعة متسقة بشكل كبير من 
حقول البيانات» ويتم تمييز كل منها بوسم مميزء ومن ثم OLE‏ فصل المحتوى بصورة دلالية 
وتوفير بيانات وصفية ذاتية التعريف بصورة مرنة واستخدامها وسيلة لفرز وترتيب وهيكلة 
السانات. ومن الأمثلة على السانات 3 4 ال منظمة صفحات الويب ال موسومة بلغة التوصيف 
الموسعة (Extensible Markup Language- XML)‏ وهی الصفحات التي تستخدم لغة 
التوصيف الموسعة (XML).‏ لتنسيق وترميز ا مستندات بصورة قابلة للقراءة UT‏ وبشريا في 
ان واحد؛ 2012 Franks‏ انظر البيانات المرتبطة في الفصل الثالث). 


في المقابلء لا تمتلك البيانات غير المنظمة نموذج بيانات محدّدا أو هيكلا تعريفيا مشتركا. 
ولكن قد يكون لكل عنصر على حدة Si‏ أو هيكل sims‏ خاص «t‏ مثل polis‏ النص 
الروائي أو الصورةء ولكن ليس كل البيانات ضمن مجموعة البيانات لها الهيكل نفسه 
على هذا النحوء وبينما هكن ف الغالب البحث والاستعلام عن البيانات غير المنظمة, إلا 
أنه ليس من السهل الجمع بينها وتحليلها باستخدام الحاسب الآلي. وتكون البيانات غير 
المنظمة نوعية بطبيعتهاء ولكن من الممكن في أغلب الأحيان تحويلها إلى بيانات منظمة 
من خلال الفرز والتصنيف. وحتى وقت قريب سينا كانت مجموعات البيانات الكبيرة 
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جدا تحوي في العموم بيانات منظمة كونها أسهل بكثير في المعالجة والتحليل والتخزين 
على هذه الحال. أما في عصر البيانات الكبيرةء فقد تكونت العديد من مجموعات البيانات 
الضخمة التي تحوي بيانات شبه منظمة أو غير منظمة» مثل التي أنتحتها المشاركات 
الاجتماعية الجماعية على مواقع التواصل الاجتماعي مثل الفيسبوك» التغريدات على تويتر 
الصور ومقاطع الفيديو المرفوعة على الشبكة العاميةء والمدونات S| (Blogs)‏ تشير بعض 
التوقعات إلى معدل زيادة في نمو هذه البيانات غير ال منظمة أو الشبه ا منظمة مقدار خمسة 
عشر liso‏ عن السانات المنظمة )2012 (Zikopoulos et al.‏ وقد صاحب ذلك تطودٌ 
في تصميم قواعد البيانات مثل قواعد البيانات غير العلاقية (NoSQL)‏ والتي لا تستخدم 
النماذج الجدولية أو قواعد البيانات العلائقية. انظر الجدول رقم 0( وتقنيات التعلم JYI‏ 
التي تساعد في التخزين والتحليل (انظر الفصل السادس). 


الببانات الملتقطة (Captured Data)‏ والبيانات المستنفدة/ المستهلكة 
c (Exhaust Data)‏ والسانات العابرة «(Transient Data)‏ والسانات المشتقة / 
المستمدة :(Derived Data)‏ 

هناك طريقتان رئيسيتان لإنتاج البيانات: الأولى هي أنه من ال ممكن الحصول على 
البيانات بصورة مباشرة من خلال شكل من أشكال القياس مثل الطملاحظةء واطسح اطميدانف» 
والتجارب المخرية وال ميدانية» وحفظ السجلات (على سبيل «JUL!‏ ملء الاستمارات أو كتابة 
المدونات): والكاميرات» وا ماسحات الضوئيةء وأجهزة الاستشعار. وف هذه الحالاتء عادة 
ما تكون البيانات هي المنتج المطلوب للقياس؛ أي أن النية هي إنتاج بيانات مفيدة. وفي 
المقابلء يتم إنتاج البيانات المستنفدة بالأصل بواسطة جهاز أو نظام» وتكون ناتج وظيفة 
رئيسية وليست ال مخرج الرئيسي )2011 .(Manyika et al.‏ فعلى سبيل JULI‏ فإن جهاز 
تسجيل الخروج الإلكتروني anabl‏ لاحتساب إجمالي البضائع التي تم شراؤها ومعالجة 
عملية الدفع لها من الممكن أن ينتج كذلك بيانات تستخدم لمراقبة المخزونء وأداء العاملينء 
وعمليات شراء العملاء. وتنتج العديد من الأنظمة المحوسبة مثل هذه البيانات المستنفدة 
والتي أصبح الكثير منها مصدرا قيما للبيانات. وف حالات أخرى: فإن البيانات المستنفدة 
تبقى بيانات عابرة بطبيعتها؛ أي أنه لم يسبق أن جرى فحصها أو معالجتها ولذا فإنه يجري 
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التخلص منهاء إما لأنها ضخمة جدا أو غير منظمة بطبيعتهاء أو مكلفة في المعالجة والتخزينء 
أو أنه يوجد نقص في تقنيات استخلاص القيمة منهاء أو لقلة الاستخدام الإستراتيجي أو 
التكتيكى لها )2012 .(Zikopoulos et al. 2012; Franks‏ ومن الأمثلة على ذلك ما ذكره 
Manyika et al. (2011: 3)‏ من òl‏ 'مقدمي خدمات الرعاية الصحية.... يتجاهلون AI‏ 
من البيانات التي ينتجونها (كالفيديوهات المسجلة أثناء العمليات الجراحية)". 

وتعد البيانات الملتقطة والبيانات المستنفدة بيانات «elo»‏ معنی أنه مم يتم تحويلها 9l‏ 
ضمّها مع غيرها من البيانات. وف «lll‏ يتم إنتاج البيانات المشتقة من خلال عمليات 
إضافية من المعالجة والتحليل للبيانات التي تم التقاطها. فعلى سبيل المثالء قد تكون 
البيانات هي تعداد حركة الأفراد على أحد التقاطعات المرورية والبيانات ال مشتقة منها هي 
التعداد الإجمالي أو التعداد لكل ساعة: فالبيانات الأخيرة استمدت من البيانات السابقة. 
وتكون البيانات التي جرى التقاطها في كثير من الأحيان مدخلا إلى نموذج العمليةء في حين 
تكون البيانات المشتقة هي المخرج عن نموذج العملية. فعلى سبيل «JULI‏ قد تكون بيانات 
الكثافة المرورية مدخلا إلى تموذج النقل والمواصلات على أن يكون المخرج هو بيانات التوقع 
أو المحاكاة (مثل حساب حركة ال مرور المتوقعة في أوقات مختلفة أو في ظل ظروف مختلفة). 
ففي حال وجود نموذج. من المرجح أن تضم بيانات التعداد/ الكثافة ال مرورية مع بيانات 
اخرى ملتقطة أو مشتقة (مثل نوع السيارة: وعدد الركاب... إلخ) لإنشاء سانات مشتقة 
جديدة قد تشكل مدخلا للنموذج. eus‏ إنتاج البيانات المشتقة لعدة أستباب» ما فيها 
الحد من حجم البيانات والتقليل منها إلى قدر مقبول من الممكن إدارته لإنتاج مقاييس 
أكثر فائدة وذات معنى. وف بعض الأحيانء قد تتم معالجة البيانات الأصلية الملتقطة إلى 
مستويات مختلفة من الاشتقاق اعتمادا على الاستخدام المقصود. ويُعد نظام وكالة الفضاء 
الأمريكية - ناسا الخاص برصد ومراقبة الأرض من الأمثلة على ذلك حيث يقدم بياناته في 
ستة مستويات تبدأ من البيانات ال ملتقطة وغير ال معالجة: وتمضى خلال درجات متزايدة 
من مستويات المعالجة والتحليل وصولا إلى مخرجات النموذج القائمة على تحليل بيانات 
المستوى الأقل )2007 ‘Borgman‏ انظر جدول (\-Y‏ 
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ا مستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية 


امد 


املستوى بيانات غير dalio‏ وغير معالجة بالدقة الكاملة وبالحالة الخام وتحوي 
كافة إضافات Slo‏ الاتصالات (Ae)‏ سل المثالء سانات التزامنء 
ترودسه الاتصال» السانات امكررة) 

المستوى الأول أ انات فو مظع 3 5:4 dodo‏ اق الكاملة: ولكن Lolo dis:xo‏ 
ومذئّلة 9l‏ متبوعة بشروحات إضافية» تشمل معاملات معايرة ومقاسس 
راديوية وجغرافيه ومؤشرات تحتسب وتضاف OLLU‏ في ال مستوى ٠‏ 
ولكن لا تطبق عليها. 


m US 


متغيرات جيوفيزيائية مشتقة بنفس 435 23529 مصدر بيانات ال مستوى 
الأول 








المستوى الثالت 2 متغيرات تمت تعيينها ق مقاييس : شبكة منتظمة للفراغ - الزمنء ف 
العادة مع بعض المكملات والتدقيق على سلامتها 





المستوى الرابع مخرج النموذج أو النتائج من التحليل لبيانات المستويات الأقل 





(المتغبرات المشتقة من قياسات متعددة). 


المصدر: مقتبس من الموقع الإلكتروني على العنوان : 


https://earthdata.nasa.gov/data/standards-and-references/processing-levels 
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«(Secondary Data) السانات الثانوية‎ (Primary Data) 4.5! السيانات‎ 
: (Tertiary Data) والسيانات العامة‎ 

يتم e L3]‏ البيانات الرئيسية (الأساسية) من قبل الباحثين وأدواتهم من خلال تصاميم 
البحوث التي يضعونها. أما البيانات الثانوية فهي البيانات التي يتم إنشاؤها من قبل 
شخص ثم تتاح للآخرين لإعادة استخدامها وتحليلها. وعلى ذلكء مكن أن تكون البيانات 
الأساسية لشخص ما هي بيانات ثانوية عند شخص آخر. أما البيانات العامة فهي شكل من 
أشكال السانات المشتقة»ء «las! Js‏ والفتات» والنتائج الإحصائية. وتصدر البيانات العامة 
غالبا من قبل الوكالات الإحصائية بدلا من البيانات الثانوية لضمان السرية للأشخاص 
الذين تشر إليهم هذه البيانات. على سبل «JUL‏ يحظر نشر البيانات الأساسية للتعداد 
السكاني الأيرلندي على أنها بيانات ثانوية إلا بعد ls‏ عام من إنتاجها؛ ولكن يتم الإفراج 
عن البيانات على صورة ملخصات إجمالية وبيانات تصنيفية عامة. ويسعى العديد من 
الباحثين والمؤسسات لإنتاج اة lanas Gs sas DN‏ لاحتياجاتهم الخاصة 
ومركز عليهاء في حين Y‏ تتوفر خيارات التضميم هذه لأولئك الذين يقومون على تحليل 
السيانات الثانوية او العامة. وعلاوة على ذلك. على اولئك الذين يستخدمون السانات 
الثانوية والعامة كمدخلات في دراساتهم الخاصة أن يتوثقوا من صلاحية البحث الأصلى 
وصحته. 

ويجمع الباحثون في كثير من الأحيان بين البيانات الأساسية والبيانات الثانوية والعامة 
لإنتاج بيانات مشتقة ذات قيمة أكبر. على سبيل JULI‏ قد تسعى متاجر التجزئة لإنشاء 
مجموعة بيانات مشتقة تدمج بيانات مبيعات الأساسية مع البيانات السكانية الجغرافية 
العامة (Tertiary geodemographics data)‏ وهي بيانات عن أي نوع من الناس الذين 
يعيشون ف مناطق مختلفة وا لمستمدة من التعداد JI‏ 38( والبيانات العامة والتجارية 
الأخرى من أجل تحديد أماكن لاستهدافها بالمواد التسويقية. إن السانات الثانوية والعامة 
ذات قيمة لأنها تمكن من اجراء الدراسات التكرارية وبناء مجموعات سانات SÍ‏ خا 
وأكثر ثراء وتعقيدا. وهي تنتج لاحقا مأ أطلق عليه )2012 (Crampton et al.‏ مصطلح 
تضخيم البيانات (Data Amplification)‏ والذي يعني أن الجمع بين البيانات يتيح رؤى 
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أكبر بكثير من خلال الكشف عن الروابطء العلاقات» والأنماط التي تبقى خافية في حال 
ظلت البيانات معزولة. ونتيجه لذلك» فإن بيانات السوق الثانوية والعامه هي صناعة 
ممليارات الدولارات (انظر الفصل (Y‏ 


السانات التأشيرية «(Indexical Data)‏ السانات الخاصية (Attribute Data)‏ 
والسانات الوصفية :(Metadata)‏ 

تختلف البيانات أيضا في النوع. فالبيانات التأشيرية هي تلك البيانات التي تتيح 
التعريف بالبيانات وربطها بغيرها من البيانات MI‏ 5,2« وتشمل معرّفات فريدة من نوعهاء 
مثل أرقام جوازات السفر وبطاقات الضمان الاجتماعيء وأرقام بطاقات الائتمانء والأرقام 
التسلسلية ال مصنعة:ء ومعرفات الكائن الرقميء. وعناوين الربط الشبي (IP and MAC)‏ 
وأرقام الشحن وطلبات الشراء» إضافة إلى الأسماءء والعناوين» والرموز البريدية. إن البيانات 
التأشيرية daga‏ لأنها تساعد في حضر كميات كبيرة من البيانات غير المفهرسة بعضها مع 
بعض وتتبعها من خلال معرّفات مشتركة» والمساعدة على التمييز بينهاء وضمهاء وتقسيمها 
وإعادة تجميعهاء والبحث فيها وغيرها من أشكال المعالجة والتحليل. وكما هو مبين في 
الفصل cael JI‏ فقد أضحت البيانات التأشيرية شائعة على نحو متزايد وبصورة متخصصة 
مما يزيد من درجة الارتباط والعلائقية بين مجموعات السانات. آما السيانات الخاصية 
فهي بيانات تمثل جوانب من الظاهرةء ولكنها ليست تأشيرية بطبيعتهاء وعلى سبيل ال مثال» 
بالنسبة إلى شخص ماء قد تكون البيانات التأشيرية هي بصمات الأصابع أو تسلسل الحمض 
النووي (DNA)‏ وقد تكون بيانات الخاصية له مثل العمرء الجنسء الطولء الوزن» لون 
العينينء فصيلة الدم: وغيرها. مع ملاحظة أن الغالبية العظمى من البيانات التي يتم 
إنشاؤها وتخزينها في الأنظمة هي بيانات الخاصية. 

البيانات الوصفية هي بيانات عن البيانات» ويمكن أن تشر البيانات الوصفية إلى 
محتوى السانات أو مجموعة البيانات كاملة. وقد تشمل البيانات الوصفية عن ال محتوى 
أسماء ووصف حقول بيانات محددة على سبيل JELI‏ رؤوس الأعمدة في جدول البيانات 
وتعريفات البيانات. وتساعد هذه البيانات الوصفية مستخدم مجموعة البيانات على 
eas‏ مكونات البيانات وتركيبتها وكيف ينبغي استخدامها وتفسيرهاء وتساعد في الدمج بين 
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مجموعات البيانات» وقابلية التشغيل البيني وتبادل البيانات بينهاء والاكتشاف» والقدرة 
على الحكم على مصدر البيانات وسندها. أما البيانات الوصفية التي تشير إلى مجموعة 
السانات كلها فلها ثلاثة أشكال )2004 .(NISO‏ فالشكل الأول يتعلق بالبيانات الوصفية 
التوضيحية والتي تشر إلى بيانات التحديد/التعريف والاكتشاف المتعلقة مجموعة 
البيانات» وتشمل polis‏ مثل الاسم» واممؤلف» والناشرء والموضوع.: والوصف. ويتضمن 
الشكل الثاني البيانات الوصفية الهيكلية والتى تشير إلى بيانات التنظيم والتغطية ممجموعة 
البيانات. ويحتوي الشكل الثالث البيانات الوصفية الإدارية التي تعكس متى وكيف تم 
إنشاء مجموعة البيانات» وتفاصيل الجوانب الفنية للبيانات» مثل صيغة تنسيق ال ملف. 
ومن الذي ملك وله صلاحية استخدام البيانات. ومن المعايير الشائعة للبيانات الوصفية 
والذي يجمع الأنواع الثلاثة للبيانات الوصفية معيار دبلن كور Dublin Core) (http://)‏ 
.(dublincore.org‏ ويشترط هذا المعيار تمتع مجموعة البيانات بخمسة عشر حقلا 
للبيانات الوصفية هي : العنوان. ال منشىء الموضوع: الوصف» الناشرء المساهم التاريخ 
النوع» الصيغة» ال معرّفء المصدرء واللغةء العلاقةء التغطية / النطاق» والحقوق / الصلاحيات. 
وبرغم ol‏ البيانات الوصفية ael do‏ المكونات الأساسية لكافة مجموعات البيانات» إلى 
أنه يجري إهمالها في ممارسات دعم الإتاحة وإعادة الاستخدام والمشاركة للبيانات Data)‏ 
Tm (Curation‏ من الباحثين الذين يجمعون البيانات الأساسية لاستخدامهم الخاص 
دون مشاركة الاخرين بها. 


(Knowledge) والمعرفة‎ (Information) والمعلومات‎ (Data) السسانات‎ 
(Wisdom) والحكمة‎ 

ما يوحد الأنواع ال مختلفة من البيانات التي تم التطرق إليها في الأجزاء السابقة هو 
أنها تشكل القاعدة أو الأساس الذي يقوم عليه هرم المعرفة: فالبيانات تسبق ال معلومات. 
وامعلومات تسبق امعرفة. والمعرفة تسبق الفهم والحكمة Adler 1986; Weinberger)‏ 
1. وتتميز كل طبقة من الهرم من خلال عملية التقطير (التقليلء التلخيص والتجريدء 
المعالجة والتجهيزء التنظيم» التحليل: التفسيرء والتطبيق) التي تضيف التنظيم» المعنى: 
والقيمة من خلال الكشف عن العلاقات والحقائق حول العام (انظر الشكل .)١-١‏ 
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ds‏ حين أن ترتيب المفاهيم داخل الهرم هو لا جدال فيه على العموم» إلا أن طبيعة 
المفاهيم والاختلافات بينها كثيرا ما تختلف بين المدارس الفكرية. فال معلومات: على سبيل 
المثال» هي المفهوم الذي يفهم على نحو مختلف بين العلماء» فبالنسبة للبعض, ا معلومات 
هي تراكم البيانات المرتبطة بهاء وبالنسبة للآخرين هي البيانات إضافة للمعنىء أو الإشارة 
ذات المعنى في ضوضاء البيانات» أو البناء متعدد الأوجه» أو البيانات العامة حيث تم 
إعادة صياغة البيانات الأساسية من خلال نموذج تحليلى. فبالنسبة لعا الفيزياء البيانات 
هي مجرد سلسلة من الأصفار والآحاد. أي tel (Bits)‏ وتعد ضوضاء .(Noise)‏ ولذلك 
فإن ال معلومات بالنسبه لعام الفيزياء تتكون عندما يتم تنظيم هذه الأعداد من الصفر 
والواحد $ أنماط متميزة؛ فهذه هى الإشارة المفيدة )2003 .(von Baeyer‏ فموجات 
الأثير وكابلات الاتصالات هي ممتلئة بال معلومات المتدفقة - كإشارات الراديو والتلفاز 
والمحادثات الهاتفية وحزم بيانات شبكة الانترنت - التي تعني أنماطا ذات مغزى من 
البيانات ضمن خزمة أوسع من الضوضاء. وبالنسبة 55,5( فال معلومات ذات مفهوم 
أوسع. فقد 332 )74 :2010 (Floridi‏ على سيل المثالء ثلاثة أنواع من المعلومات : 
o‏ الواقعبة :(Factual)‏ معلومات تعكس الحقيقة (على سبل «JULI‏ الأنماط. بصمات 

gale‏ وحلقات جدوع الأشجار). 


« التعليمية :(Instrucional)‏ معلومات لأجل الحقيقة (Ae)‏ سبل المثالء الأوامن 
«Las lg‏ والوصفات). 

o‏ الدلالية :(Semantic)‏ معلومات عن الحقيقة (e)‏ سسل «JULI‏ الحداول الزمنية 
للقطارات» الخرائطء والسير الذاتية). 
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شكل )١-١(‏ 
هرم المعرفة (منقول من 2010 (Adler 1986 and McCandless‏ 





المعرفة 
التحليل التفسير معلومات منظمة 
المعلومات 
Mmm‏ عناصر مرتبطة 


السانات 


التقليص التجريد فا ج 


فالنوع الأول هو أساسا بيانات ذات «uisa‏ وهو ما يطلق عليه عادة الحقائق. وهي 
البيانقات التي يتم تنظيمها وتركيبها ضمن نظام قياس أو مرجع خارجي يوفر يطبيعته 
أساسا لإنشاء ال معنى الأول الذي يحمل بعض الحقيقة. وتمتد ال معلومات أيضا إلى ما 
بعد البيانات والحقائق من خلال إضافة قيمة تساعد على التفسير. caleg‏ أوضح 
(Weinberger 2011: 2)‏ أن : "المعلومات بالنسبة للساناتء كالنسيذ بالشسية لحقل 
العنب: استخراج نواتج التقطير اللذيذة! ". ولذا هكن الحصول على هذه القيمة من 
خلال فرز» وتصنيف» وربطء وإضافة المحتوى الدلالي من خلال بعض الشكل النصي أو 
الصوري والذي يشير إلى شيء ما و/ أو يرشد إلى ما ينبغي القيام به (على سبيل JELI‏ 
الإشارة الضوتية التحذيرية على dag)‏ معلومات مؤشرات عمل السيارة التي تشير إلى 
فراغ البطارية وحاجتها لإعادة الشحنء 2010 (Floridi,‏ وقد gu‏ (2002: ملخصا ف 
Borgman 2007: 40) Case‏ أن الاختلافات في تعريف ال معلومات تتوقف على خمس 
مسائل: 
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عدم اليقين Uncertainty)‏ أو ما إذا كان شيء ما قد يحد من عدم اليقين 
في تأهيل البيانات لتكون معلومات؛ المادية (Physicality)‏ أو ما إذا كان 
شيء ينبغي أن يؤخذ على شكل مادی مثل كتابء أو كائن: أو موجات صوتية 
لكلمة خطبب لتأهل البيانات لتكون معلومات؛ البنية / العملية Structure/)‏ 
(Process‏ أو ما إذا كان يلزم مجموعة من الترتسات أو العلاقات؛ القصد والعزمة 
(Intentionality)‏ أو ما اذا كان شخص ما قد أوعز Ob‏ شيئا ما تم التواصل معه 
ليتأهل ليكون معلومات؛ والحقيقة (Truth)‏ أو ما إذا كان ينبغي أن يكون 
الشيء busa‏ التاجل ليكون لفات 
وبغض النظر عن كيفية تصور US‏ فقد لاحظ )2010 (Floridi‏ أنه بالنظر إلى إضافة 
المعلومات المعنى إلى البيانات» فهي تكتسب القيمة الربحية كسلعة, غير أنهاء كنوع متميز 
من السلعء تمتلك ثلاثة خصائص رئيسية مميزة (والتي تتميز بها البيانات أيضا): 
غير تنافسية ( :(Non-rivalrous‏ حيث من الممكن لأكثر من مستخدم أن متلك نفس 
المعلومات دون التأثير على مذى استفادة المستخدمين الآخرين منها (على عكس السلع 
امادية المستهلكة). 
غير قابلة للاستثناء أو الإقصاء :(Non-excludable)‏ حيث يتم تقاسمها ومشاركتها 
بسهولة ويلزم بذل جهد كبير في السعي للحد من مثل هذه ال مشاركة (مثل فرض اتفاقيات 
حقوق الملكية الفكرية أو إضافة حواجز الدفع (Paywalls)‏ قبل الاستخدام). 
التكلفة الهامشية :(Zero Marginal Cost)‏ مجرد إتاحة المعلومات من اطرة الأولىء 
فإن تكلفة الاستنساخ أو إعادة الإنتاج في كثير من الأحيان لا تكاد تذكر. 
ومع التنديد على خصائص كون ال معلومات مورد يتميز بعدم ال منازعة وعدم الاستثناء 
ولأن المعلومات lol. d‏ قيمه. تسعى العديد من laua) OLLI‏ والحد من تداولها 
والسيطرة عليها ومن تم زيادة قيمتها. ومعظم هذه القيمة تضاف من خلال العمليات 
التي تفرض خلال دورة حياة المعلومات )2010 (Floridi‏ وال مشتملة على المراحل التالية: 
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الوجود (Occurrence)‏ الاكتشاف» التصميم» التأليف. 
الإرسال :(Transmission)‏ التشبيك» التوزيع» النفاذ. الاسترجاع النقل. 


امعالجة والإدارة :(Processing and Management)‏ الجمع. التحققء. التعديل؛: 
التنظيم؛ الفرزء التصنيف. التصفية؛ «oA‏ التخزين. 

الاستخدام (Usage)‏ الرصد وامراقبة: النمذجة. التحليل. الشرح. التخطيط التنبؤ 
اتخاذ القرارات» التوجيه» التعليم» التعلم. 

ومن خلال المعالجة والإدارة والاستخدام يتم تحويل ال معلومات إلى معرفة أكثر قيمة. 


وكما هو الحال مع جميع ال مفاهيم في هرم ال معرفة. وبامثلء يختلف فهم مفهوم 
المعرفة. فبالنسبة للبعضء المعرفة هي الدراية التي تحول المعلومات إلى تعليمات 
.(Weinberger 2011: 3)‏ فعلى سبيل «JUL‏ مكن ربط ال معلومات الدلالية إلى وصفات 
وتعليمات (أولا قم das‏ ثكم افعل ذلك..) أو نموذج شرظى لإجراءات استنتاجية (إذا 
كان الحال هو كذا وكذا فافعل IIS‏ وإلا افعل .(Floridi 2010) (lis‏ في هذا التأطير 
تكون المعلومات هي البيانات الهيكلية: وامعرفة هي معلومات إجرائية قابلة للتنفيذ 
(Weinberger 2011)‏ وبعبارة أخرىء "المعرفة هي الوصفة التي تحؤل ال معلومات 
إلى الخضز القابل JSW‏ بينما البيانات هى العناصر ال مكونة للدقيق والخميرة' Zelany)‏ 
7 ؛ منقول عن 2011 dabo .(Weinberger‏ للاخرین» فإن المعرفه هي 51 کی 
مجرد مجموعة من التعليمات ؛ ويمكن أن تكون المهارات ddadl‏ وأبعد بكثير عن مجرد 
وسيلة لمعرفة كيفية إجراء أو تحقيق المهمة: أو النظام الفكري الذي يربط بشكل متسق 
ا معلومات مع بعضها البعض للكشف عن صورة أوسع لظاهرة ما. وينطوي إيجاد 
المعرفة على تطبيق العمليات ال معرفية المعقدة على المعلومات مثل الإدراك» والجمع 
والتركيب» والاستخلاص. والدمج والتكوين؛ والاستنتاج والربط. وللمعرفة قيمة أكبر من 
قيمة المعلومات لأنها توفر أساسا لفهم» وتوضيح. ورسم رؤى حول ("ls bll‏ من 
الممكن استخدامها في صياغة السياسات والإجراءات. أما الحكمة» التي تحتل قمة هرم 
s‏ ,45( فهي القدرة على تطبيق ال معرفة برجاحة وروية. 
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وبرغم أنه ل (Labs‏ بثبات علاقة كل أشكال المعرفة بالبيانات» على سبيل JELI‏ التخمين 
والآراء وال معتقدات» إلا أن البيانات تشكل بوضوح مادة القاعدة الرئيسية لكيفية استشعار 
الواقع والعالم من حولنا. حيث تشكل البيانات المدخلات الأساسية في العمليات مثل 
الجمع» الفرزء التصنيف» المطابقةء التشخيص / التنميطء والنمذجة التي تسعى إلى إنشاء 
المعلومات والمعرفة من أجل فهم الظواهرء والتنبؤ بها وضبطها والسيطرة عليها. كما 
مكننا إنتاج البيانات بمرور الوقت وف أماكن مختلفة من تتبع» وتقييم» ومقارنة الظواهر 
عبر الأزمنة والأماكن والنطاقات. وهكذاء وعلى الرغم من أنه ينظر إلى المعلومات وا معرفة 
إلى كونها مفاهيم ذات درجة أغلى وقيمة أك تبقى البيانات: مع ذلك: عنصرا أساسيا مع 
قيمة كامنة كبيرة يجرى إدراكها وتحصيلها عند تحويلها إلى معلومات ومعارف. فالدافع 
المنطقي الرئيسي لخركة البيانات المفتوحة» والتي بحثت في الفصل الثالث» هو القدرة على 
الوصول إلى القيمة الكامنة في مجموعات بيانات القطاعات الإدارية والعامة. 


(Framing Data) البيانات‎ pbl 
بالفعل صياغة البيانات من الناحية النظرية من حيث‎ colo حتى الآن 3( هذا الفصلء فقد‎ 
مناقشة أنطولوجيا البيانات (ماهية وجودها)ء وأشكالها المختلفة. وأين تتموضع داخل هرم‎ 
ا معرفة. كما أن هناك عددا لا يحصى من الطرق الأخرى التي يمكن بها فهم البيانات والتفكير‎ 
من المنظور التقني الخاص بجودة البيانات» وصحتهاء وموثوقيتهاء‎ JULI بهاء على سبيل‎ 
ونسبتهاء وقابليتها للاستخدام» وكيف مكن معالجتها وتنظيمهاء وتقاسمهاء وتحليلها؛ أو‎ 
من ال منظور الأخلاقي المتعلق بالأسباب التي دفعت إلى إنتاج البيانات والاستخدامات التي‎ 
يتم توظيفها بها؛ أو من المنظور السياسي أو الاقتصادي والذي يأخذ بعين الاعتبار التصور‎ 
«gels المعياري للبيانات ومواضع الطعن والتنازع والتنافس فيها كمنفعة عامة» ورأس مال‎ 
وملكية فكرية» أو سلعة تجارية»ء وكيف يتم تنظيمها وتداولها؛ أو من ال منظور المكاني و/ أو‎ 
الزماني المتعلق بكيفية إنتاج البيانات وتطوير استخداماتها ومحاور تركيزها من قبل الأنظمة‎ 
والمجموعات التقنيةء والأخلاقيةء والسياسيةء والاقتصادية عبر المكان والزمان؛ أو من المنظور‎ 
الفلسفي الذي يأخذ بعين الاعتبار المفاهيم المبدئية وا معرفية للبيانات. وسنرجع لاستذكار‎ 

العديد من القضاياء التي تم بحثها في هذا القسم لاحقا في جميع أجزاء الكتاب ALAN‏ 
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المنظور الفني :(Technically)‏ 

في جميع التخصصات. يتم أخذ البيانات بعين الاعتبار من وجهة النظر التقنية ال معيارية. 
والسؤال المطروح على elt!‏ هو إلى أي مدى تنتج طرق التقاط البيانات وقياسها بيانات 
محددة: ونظيفةء 42,959( وكيف ممكن وينبغي doles‏ وتنظيم» ومشاركة. وتحليل هذه 
البيانات بطرق تحافظ على سلامتهاء من أجل ضمان موثوقيتها وصلاحية الاستنتاجات 
اللستخلضة فتها: ولذا كان هنالك Ulo‏ شكوك فيما تعلق بضحة النبانات لأنها بطبيعتها 
محردة. وعمومية: وتقرسة عند إنتاجها )2009 «AUS Cus .(Goodchild‏ فقد توجه 
الكثير من الاهتمام إلى قضايا تتعلق olis‏ تمثيل البيانات (Data representativeness)‏ 
وعدم اليقين بصحتها (Uncertainty)‏ ودرجة الموثوقية بها (Reliability)‏ والأخطاء 
اممكنة ال مصاحبة لها (Error)‏ والتحيز ال منتقص مصداقية دلالاتها (Bias)‏ وامعايرة 
(Calibration)‏ في تصميم البحوث وتطبيقاتها. وتسجيل هذه ال معلومات كبيانات وصفية. 


وبالنظر للبيانات على dae lil‏ بديلة عن بعض جوانب ظاهرة ما - كالضوء ثل نجماء 
والخصائص الفيزيائية التي تمثل مبنى» والكلمات التي تمثل أفكار شخص - يتعلق التمثيل 
sas (Representativeness)‏ التقاط البيانات لهذه الظاهرة التي تسعى إلى تمثيلهاء dis‏ 
أي مدى تمثل عينة البيانات التى تم إنشاؤها المجتمع الكامل للظاهرة. وفيما يتعلق 
بالسؤال السابقء فإن السؤال الرئيسي هو إلى أي مدى يمكن أن نكون على ثقة من أن 
التقنيات العلمية قد التقطت بدقة الظاهرة قد الدراسة. لقد مثل هذا التساؤل مشكلة 
خاصة في مجال العلوم الاجتماعية والإنسانية وأثبت أنه كان من الصعب حلها. فعلى 
سبيل ال مثال» لوحظ بشكل كبير أن ما يقول الناس أنهم سيفعلون وما يفعلونه في الغالب 
ما يكون مختلفا تماما عن الواقع: وما يفعله الناس في كثير من الأحيان قد لا يقصدونه. 
ولذلك برز سؤال حول المدى الذي تمثله بيانات المقابلة الشخصية للسلوك البشريء أو 
مدى تمثيل الفكر الواعي لهم. وباممثل» هناك مخاوف بشأن مدى التقاط وتمثيل المؤشرات 
الرئيسية للتعبير بدرجة كافية عن slol LAS‏ مجال ما. على سبيل المثالء إلى أي مدى 
تعطي المؤشرات المتعلقة بعدد مرات الاقتباس» ومؤشر إتش (H-index)‏ وبراءات الاختراع 
المسجلة دلالة على أداء عالي الجودة من قبل موظفي الجامعة (مع الاحترام لأعضاء هيئة 
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التدريس ف مجال العلوم الإنسانية فإن هذه المؤشرات تعد سيئة للغاية)؟ ولذا كان الحل في 
محاولة تطوير تصاميم بحثية أكثر تعقيدا لمواجهة أوجه القصور ف هذه الأساليب اممختلفة 
أو تجاهل أوجه القصور المتعلقة بها إلى حد كبير. 

وبالنسبة لما يتعلق بمدى تمثيل عينة لمجتمع دراسة ماء فقد نقررء اعتمادا على خمسين 
نجمة» إنتاج بيانات فلكية هائلة» ومفصلةء وعلى مدى طويل من أجل فهم أفضل 
لطبيعتها. ولكن إلى أي مدى يمكن أن نكون على ثقة ob‏ هذه الخمسين نجمة تمثل مجمل 
خصائص المليارات الأخرى من النجوم الموجودة؟ وحتى في عصر البيانات الكبيرةء التي 
تسعى إلى أن تكون شاملة وليست انتقائية في إنتاج البيانات (انظر الفصل الرابع)ء فإن 
البيانات هي بطبيعتها عينة (فليس كل الناس يستخدمون وسائل التواصل الاجتماعي أو 
يتسوقون باستخدام البطاقات الائتمانية» وبالتأكيد لا يمتلك كثير من الناس في جميع أنحاء 
العام حق الوصول إلى الهواتف وأجهزة الحاسب)»ء وهذا يعني أن البيانات هي ممثلة 
de ecd‏ مر آ0 اوی کیک 5 كنيد GS 5551 5329. ae 695 e eas!‏ الحل هو 
jl‏ مجموعة من تقنيات أخذ العينات التي تسعى إلى ضمان التمثيل الدقيق في ظل 
مختلف الظروف (lg)‏ تعتمد غالبا على عينة عشوائية). واستحداث أساليب إحصائية 
تقوم بحساب مدى الثقة التي يمكننا أن نكون عليها حيال تمثيل عينة ما طمجتمع الدراسة 
(Kitchin and Tate 1999)‏ 

وتتعلق الموثوقية بالتكرارية أو الاتساق في الحصول على النتيجة نفسها من توظيف 
à JI‏ البحث. وقد وصف )1997 (Golledge and Stimson‏ ثلانة أنواع من اطوثوقبة: 
(Y)‏ اطوثوقية التصورئة (quixotic reliability)‏ حيث 535( di Jo‏ واحدة للملاحظة 
والاستكشاف إلى قياس غير متغر باستمرار. (Y)‏ الموثوقية الزمنية المتعاقية Diachronic)‏ 
(Reliability‏ وفيها يكون استقرار الملاحظات عر الزمن. (Y)‏ الموثوقية التزامنية 
(Synchronic Reliability)‏ وفيها يكون التشابه في الملاحظات خلال الفترة الزمنية نفسها. 
وتعد اموثوقية مهمة dX‏ من المسلم به آنه كلما كان القیاس أكثر اتساقا في إنتاج البيانات» 
أمكن بشكل SÍ‏ وصف هذه السانات بأنها بيانات موثوقة. 
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والخطأ هو الفرق بين القيمة المقاسة والقيمة الحقيقيةء ويمكن أن يشمل الغيابات 
البيانات المفقودةء والأخطاء مثل الخطأ في الإدخال / الترميز أو الخطأ في التصنيف أو سوء 
تطبيق الأسلوب التقني» وسوء الفهم. أما التحيز فهو نوع معين من dhal‏ حيث تنحرف 
OLLI‏ بسبب Jae‏ ثابت من الخطأ. وعادة ما يحدث التحيز بسي الطريقة: أو SII‏ 
أو أسلوب أخذ العينات المستخدم لإنشاء البيانات والتي لها تأثير مفرط على البيانات التي 
يتم إنتاجهاء أو يمكن تقدهها بسبب موقف إيديولوجي أو تطلعات الباحث في كثير من 
الأحيان بطريقة غير متعمدة )1996 .(Kitchin‏ ومن الممكن أن تتسبب آليات ال معالجة 
مثل التجميع أو الإجمال في إحداث تحيز من خلال الحدذ من التباين في مجموعة البيانات 
مما يؤدىي إلى أخطاء المغالطة المنطقية للاستدلال البيئي (Ecological Fallacy Errrors)‏ 
معنى أنه على افتراض تمثيل القيمة الإجماليه مجموع الأفراد بدقة على مدل JULI‏ إذا 
كان ouai La)‏ وزنهما 6٠‏ کیلوجراما وآخرين وزنهما.*6١1‏ كيلوجراما فشيُكون متوسط 
الوزن الإجمالي هو٠١٠‏ كيلوجرام» ولكن لا أحد في المجموعة يزن هذا الوزن في الواقع 
(Kitchin and Fotheringham 1997)‏ ويتعلق مفهوم عدم اليقين بمدى ثقة الباحث 
بخصوص دقة البيانات وأي تحليل قائم على أساسها. أما فيما يتعلق بالبيانات الكمية, 
فيتصل بدرجة اليقين بالاختبار الإحصائي وذلك بالنظر إلى البيانات المدخلةء وعادة تحتسب 
على أساس الاحتمالات ويعبر عنها مستويات الثقة )2009 .(Goodchild‏ أما مفهوم عدم 
اليقين بالنسبة للبيانات النوعية. فيجري في الغالب تقييمه والحكم عليه من قبل خبير بناء 
على الخيرة السابقة. 

وتتمثل دعائم معالجة هذه ا مخاوف بالإيمان ob‏ مثل هذه القضايا تنشأ بسبب الضعف 
البشري في تصميم البحث أو أوجه القصور وعدم كفاءة الأدوات والمعدات أو الطرق 
المستخدمة والتي من الممكن التغلب عليها من خلال الحلول التقنية. وهذا يعني أنه من 
الممكن معالجتها عن طريق تحسين نوعية الإجراءات وال معدات المستخدمة» وتطبيق أنظمة 
التوحيد القياسي (التقييس - (Standardization‏ والتي توفر معايير جودة البيانات المعروفة 
مشل تلك التي أقرتها المنظمة الدولية للمعايير آيزو ISO)‏ والتي تعمل على إيجاد سبل 
للتعويض عن عدم اليقين والخطأ والتحيز في وسائل التحليل المستخدمة. 
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المنظور الأخلاقي (Ethically)‏ 

الأخلاق معنيّة بالفكر والممارسة المتعلقة بمفاهيم القيم مثل العدالةء والمساواة. 
والنزاهة: والصدق» والاحترام» والحقوق» والواجبات» والرعاية. esos‏ كل مجتمع وفق 
مزيج من القيم الأخلاقية الفطرية البديهية والعامية غير الرسمية: eL‏ بهاء واطواقف 
الأخلاقة mm uall‏ والمنصوص عليها في قواعد. ومبادئ» Usus‏ وتراخيصء وقوانن 
تخضع للإنفاذ من قبل أجهزة الدولة والوكالات lis 4552 MI‏ ماتكون هذه اطواقف 
الأخلاقية محل نزاع بين مجموعات مختلفة تأخذ وجهات نظر متناقضة عن القيم نفسها 
ls‏ أي مدى ينبغي إخضاع المواقف الأخلاقية للتشريع القانوني» ومناقشتها كممارسة في 
الفلسفة الأخلاقية. كما يوجد مثل هذا الطعن فيما يتعلق بالبيانات. وخاصة ما يتعلق Le‏ 
يتم إنشاؤه من بيانات ووسائل الإنتاج لهاء وكيفية مشاركة البيانات وتقاسمهاء وتداولهاء 
وحمايتهاء وإلى الحدود التي ينتهى عندها العمل بها. 

ففي حينء تعد بعض البيانات معتدلة نسبياء على سبيل JUL‏ القياسات المتعلقة 
بالطقسء. فإن بعض البيانات الأخرى تعد حساسة abl‏ كالبيانات المتعلقة بالأفراد والتى 
مكن استخدامها لإنتاج صورة مفصلة عن الحياة المعيشية (ea)‏ وضبط وتنظيم تلك الحياة 
على إيقاع معين: وقد.يلحق إنتاج البيانات ضررا فى بعض الحالات» على ستيل المثال 
الأضرار التي قد تنتج عن إجراء مقابلات مع ناجين من جرائم الحرب وما قد تتسبب 
فيه تلك امقابلات من ضغوطات نفسية وضيق. وف هذا المقام. هناك تساؤلات حول 
المدى الذي من الممكن أن يشكل فيه إنتاج البيانات. ومختلف أشكال الراقبة والترصد 
للسانات (Dataveillance)‏ أي امراقة والرصد من خلال dalea‏ وتحليل سجلات DLJI‏ 
وتحليل البيانات bass‏ على الخصوصية وحقوق الإنسان الأخرى. وتساؤلات TR‏ حول 
امدى الذى ممكن أن تستخدم فبه هذه السانات بفعالية لفرز الأفراد اجتماعا معنى تقديم 
خدمات تفضلىهة على isl‏ خصائص الأفراد امميزة لهم )2005 (Graham‏ وتتعاظم 
هذه ال مخاوف بالنظر إلى سهولة جمع ومشاركة وتداول البيانات الرقمية» ونحن نعيش في 
عصر توليد البيانات ومراقبتها بصورة طاغية وعلى نطاق واسع. ولعله ليس من المستغرب 
بعد ذلك آن وكالات تمويل Jl‏ العلمي ومؤسسات التعليم العالي الان تقيّم بشكل دورى 
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الأبعاد الأخلاقية للمشاريع البحثية نظرا لآثارها المحتملة على نطاق ugi‏ وإضافة لذلك 
فقد سنّت الدول تشريعات» مثل قوانين حماية البيانات وقوانين الخصوصية: في محاولة gil‏ 
سوء الاستخدام والتجاوزات المسيئة للبيانات» ولقد تم مناقشة هذه المسائل وما يتصل بها 
بشكل مفصل ف الفصل العاشر. 


المنظور السياسي والاقتصادي :(Politically and Economically)‏ 
مثل الاهتمام بالمنظور الأخلاقي للبيانات البداية للكشف عن الطرق التي تعمل على 
تأطير البيانات من خلال الاهتمامات السياسية والاقتصادية على نطاق أوسع. وتتعلق 
هذه الاهتمامات بماهية البيانات التي يتم إنشاؤهاء وكيفية معالجتهاء وتحليلهاء وتوظيفها 
بالنسبة إلى: كيفية تضور البيانات وتوصيفها معياريا ضمن المجموعات الشكانية وتوظيفها 
من قبل الدول: ومفاهيم الكيفية التي ينبغي بها تنظيم البيانات وتقنينها؛ والمناقشات التي 
تطرح ضمن مجموعات الاختصاص التي تؤيد أو تعارض إنتاج البيانات وتطبيقاتها؛ واتخاذ 
القرار حول التمويل والاستثمار في البيانات؛ وانتشار الرأسمالية والطرق التي تستخدم 
البيانات لإدارة المساعي وزيادة القيمة والأرباح؛ والتداول للبيانات كسلعة مع ظهور سوق 
للسانات S‏ قيمته مليارات الدولارات والتي يشارك فيها مجموعة متنوعة من اللاعين 
كالمنتجينء المجمّعين» البائعين» ال محللين» والمستهلكينء انظر الفصل الثانى. فمنتجو البيانات 
ينبغي eade‏ الأخذ بعين الاعتبار الرآي العام والسياسيء والاعتبارات الأخلاقية والبيئة 
التنظيمية والتمويل المتاح وسلامة استثماراتهم إزاء الموارد. كما ينبغي على أولئك القائمين 
على الساحتين التشريعية والتمويل IU‏ أن يكون لديهم سعة الأفق واتخاذ القرارات حول 
كيفية تشكيل ال مشهد الذي يعمل به منتجو ومستخدمو البيانات» وكذلك النظر ف أنظمة 
العمل اللمتعلقة بالبيانات الخاصة بهم وما يكشفونه عن جداول أعمالهم وأولوياتهم 

وأساليب الإدارة والحوكمة الخاصة بهم )2012 (Lauriault‏ 

وف كلتا الحالتين» هناك مجموعة متنوعة من العلاقات السياسية والاقتصادية العقلانية 
في المشهدء مع أصوات متنافسة تسعى SEU‏ على الرأي ومشهد البيانات على النطاق 
الأوسع. فعلى سبيل JELI‏ فإن حركة البيانات المفتوحة تمثّل البيانات كسلعة عامة تتشكل 
من العموم وتكون ف متناول الجميع بحرية مطلقة باستثناء البيانات الحساسة أمنياء 
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تصور مفهوم البيانات 


والشخصية الخاصة أو مكن الوصول إليها من خلال اتفاقيات الاستخدام العادل. وف 
المقابلء يعرض قطاع الأعمال البيانات كسلعة تجارية قيّمة تحتاج من جهة إلى الحماية 
من خلال أنظمة الطلكية الفكرية (حقوق الطبع والنشرء براءات الاختراع» وحقوق ال ملكية) 
ولكن» من جهة أخرى لا ينبغي ربطها بشدة بالمحاذير الأخلاقية التي تمنع من استغلالها 
لتحقيق المكاسب AJU‏ أما بالنسبة للمجتمعات والدولء فالبيانات هي الوسائل التي 
يمكن من خلالها تقنين» وممارسة. ومنازعة الأجندات السياسية والأعمال عبر تمكين بناء 
الإثباتات - أي الروايات المسندة والدعوات المضادة التي لها قيمة بلاغية أكبر من مجرد 
التندر أو دغدغهة المشاعر )2013 .(Wilson 2011; Garvey‏ وبعبارة 5,21« تعد السانات 
بالنسبة bll‏ الفلسفة الفرنسي 1981( (Foucault's‏ شكلا من أشكال السلطة / المعرفة؛ أي 
وسيلة يمكن من خلالها ضبط وتنظيم الشعوب» والظواهرء والأقاليم )2012 (Lauriault‏ 
وتتقاطع هذه الاهتمامات وال مصالح البديلة في كثير من الأحيان بطرق متناقضة؛ من حيث 
أنه قد os‏ لها أجندات مختلفة تماماء على سبيل المثال دعم الأعمال التجازية الكبيرة 
لحركة البيانات المفتوحة فما يتعلق LOU UD‏ العامة (انظر الفصل الثالث). وبعمارة 
أخرىء تظهر البيانات جليا وتتموضع ضمن الاقتضاذات السياسية المعقدة, وف الوقت 
نفسه فهى تستخدم لتشكيل Jio‏ هذه القضايا والنظم وال مجموعات. 

وعلاوة على ذلك. تشكل البيانات مورد اقتصادياء. وهي عنصر أساسي ف المرحلة ALAL‏ 
من الاقتصاد القائم على المعرفةء وتعمل على إعادة تشكيل نمط الإنتاج القائم على البيانات 
(انظر الفصل السابع). ومنذ أواخر الثمانينيات (19805): يرى بعض العلماء مثل Castells‏ 
)1996 ,1988( أن آخر دورة للرأسمالية يدعمها إنتاج المعرفة التي تنشئ منتجات وأشكال 
عمالة جديدة. وتسهل إعادة الهدكلة الاقتصادية: وتعزز الإنتاجية والقدرة التنافسية: والكفاءة: 
والاستدامةء وتراكم رأس ال مال. وتعد البيانات الكبيرةء على وجه الخصوصء هي أحدث 
التطورات المتعلقة بتعميق وتعزيز هذه الدورةء وتوفير ثورة من الأدلة التي يتم استخدامها 
من قبل الشركات من جهة» لرصد وتقييم أذاء الشركة اللحظيء والحد من الهدر والاحتيالء 
وتحسين إستراتيجية الشركات» والتخطيط وصنع القرارء ومن جهة $55« لتصميم سلع جديدة 
وتحديد واستهداف أسواق جديدة: وتطبيق التسعر المتغيرء وإدراك الإمكانات غير ا مستغلة, 
واكتساب ميزة تنافسية )2012 (Manyika et al. 2011: Zikopoulos et al.‏ وق سبيل 
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القيام «eo‏ يمكن إنتاج وتحليل البيانات من تشغيل الشركات بشكل أكثر ذكاء فيما يتعلق 
بكيفية تنظيمها وتشغيلهاء وتعزيز المرونة والابتكارء والحد من ال مخاطر والتكاليف والخسائر 
التشغيليةء وتحسين تجربة العملاء. وتعظيم العائد من الاستثمار والأرباح. وكقائد لعملية 
تراكم راش «JUS‏ ستسهم البيانات الكبيرة في إيجاد أعمال (وظائف) جديدة وف الجولة ال مقبلة 
من التنمية غير المتوازنةء ومن هذا ا منظور يمكن فهم البيانات على il‏ وكيل لمصالح رأس JUI‏ 
واهتماماته. 


المنظور الزماني والمكاني :(Temporally and Spatially)‏ 
تمتلك البيانات أبعادا زمانية ومكانية على do‏ سواء. حيث تختلف ماهية البيانات التي 
يتم إنتاجها والطرق التي يتم بها معالجتهاء وتحليلهاء وتخزينهاء أو التخلص منها باختلاف 
الزمان وال مكان؛ أي أن للبيانات ومجاميعها المحيطة بها دلالات تاريخية وجغرافية. كما 
تتغير كيفية معالجة البيانات وتحليلها مع مرور الوقت» متأثرة بالتغيرات والتحسينات 
التنظيمية فى التعذاد والإدارةء والقوانين الجديدة المتعلقة بتداول البيانات وحمايتهاء 
والتقنيات الجديدة. والطرق الجديدة في فرز البيانات وتحليلهاء والاختلافات الإحصائية 
الجغرافية مثل حدود المقاطعة المحلية أو الوطنية الجديدة: والأسالي الإحصائية الجديدة. 
وعلاوة على ذلك» يمكن مجاميع البيانات التي تستخدم في ولاية معينة أن تكون مختلفة 
La‏ عن تلك التي تستخدم في 5,51« وحتى داخل حدود الولاية الواحدةء فقد تختلف 
الطريقة التي يقوم فيها كيان ما بإنتاج البيانات وإدارتها بسبب التقلبات المؤسسية أو 

الشنخصهة. 


وبالنظر في التعدادات JI‏ 41$« يتكون التعداد من مسح شامل طنطقة وساكنيهاء 
ويتم إجراء المسح ف العادة كل عشر سنواتء والهدف من ذلك هو جمع معلومات 
أساسية حول المقيمين في منطقة ما وخصائصهم على سبيل «JULI‏ العمرء الجنس» الحالة 
الاجتماعية: التركيبة الأسريةء الدينء العرق» الطبقة الاجتماعية. وما إلى ذلك وجوانب 
عيشهم فيها (عملهم» ومكان الإقامة. وما إلى ذلك). ويتطلب تمكين قياس التغيير في 
التعدادات السكانية الاستمرارية فيما يتعلق بالأسئلة المطروحة فيها والكيفية التي تدار 
بها هذه التعدادات. وف ذات الوقت» يتطلب التقاط البيانات الجديدة موضع الاهتمام 
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والتي تعكس تغيرات أوسع ف المجتمع: إجراء تغييرات على آلية هذه التعدادات» Jio‏ 
إضافة أسئلة جديدة أو التعديل على الأستلة الأساسية (انظر الشكل :V-Y‏ ولاحظ كيف أنه 
حتى عندما تم م الحفاظ على الأسئلة عبر التعدادات السكانية المتعاقة» فإن 4S‏ صباغتها 
كانت غالبا ما تكون مختلفة تماما في كل مرة). وعلاوة على ذلك» فإن الكيفية التي 
يدار بها التعداد ls I‏ كانت JS Li‏ ق التعدادات المتعاقبة من قبل قوى مؤسسية: 
وساسية: واقتصادية:. وتطورات dui‏ جديدة : انظر 1991( (Linehan‏ للتعرف على 
تاريخ التعداد السكانى الايرلندي من Y - VAYY‏ 443« و2012) (Lauriault‏ لتحليل التعداد 
الكندى من .V«YV - ۱۸۷١‏ علاوة على «US‏ يتعرض التعداد للطعن والتفاوض Cu‏ 
تتنافس مصالح خاصة qua)‏ أو تغييرء أو إزالة الأسئلة منها. وف بعض الحالاتء يمكن أن 
تكون التغييرات المظلوبة جذرية بشكل متطرفء مثل القرار cibos GUII‏ إإجراء التعداد 
السكاني في الثمانينات (انظر 2011 (Hannah‏ ونتيجة لذلك» يرزح التعداد الوطنى Llo‏ 
تحت وظأة التوتر الناتج عن الاستمرارية والتغيير» ومع US‏ يتطور مع مرور الوقت وف 
مناطق جغرافة مختلفة. وحتى «NI‏ ومع US‏ فقد كان هناك عدد قليل من مجاميع 
السانات المميزة تارد Gu‏ وجغر Alder 2002; Desrosiéres 1988; Hannah 2011;) Là‏ 
(Hewitt 2010: Lauriault 2012; Poovey 1998; Porter 1995‏ 
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شکل )1-7( 
الأسئلة المتعلقة بالأفراد خلال التعداد السكاني الايرلندي للسكان ما بين ١9141 - 186١‏ 
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المصدر : منقول بتصرف عن 1991 .Linehan‏ 
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المنظور الفلسفي :(Philosophically)‏ 

بالنسبة للبعضء تعد البيانات على المستوى الوجودي (Ontological level)‏ حميدة 
(غير خطرة). فالبيانات هي مجرد بيانات» وعناصر أساسية يتم استخراجها من العام 
بطرق محايدة وموضوعية تخضع لقيود تقنية. فهي "لا تمتلك أي معان ضمنية كامنة 
فيهاء ولا تقدّم بالضرورة أي تفسيرات أو آراء. ولا تحمل خصائص دلالية قد تكشف عن 
أهميتها وصلاتها " )2010 (Pérez- Montoro and Díaz Nafría‏ فهي تخمينية قابلة 
للتحليل. ومن هذا المنظورء فإن حهاز الاستشعار (sensor)‏ على سبل JULI‏ ليس لدبه أي 
سياسة أو جدول أعمال. فهو ببساطة يقيس الضوء أو الحرارة أو الرطوبة. ...الخ - حيث 
يقوم بإنتاج القراءات التي تعكس حقيقة الواقع عن العام المحيط مالم يشوبه خلل فني. 
وبعبارة أخرىء تنتج أجهزة الاستشعار نظرة موضوعية واقعية عن العام وتكشف عن 
الأشياء كما هي في الواقع» حيث إن قياس واقعية الشيء هو مستقل عن عملية القياس له 
L] .(Desrosiéres 1998)‏ في إطار عمليات القياس التي يلعب فيها العنصر البشري ls»‏ 
مركزيا - في التجارب do so‏ أو إجراء مسح ميداني أو مقابلة شخصية - فإن عمليات 
القياس تطبّق شكلا من أشكل الموضوعية الميكانيكية التي تلتزم بقواعد محددّة. وطرق 
منهجية دقيقة لإنتاج بيانات منفصلة: غير متصلةء ونزيهة على نحو شفافء وخالية من 
تحيز الباحث وهواه A235‏ ,33« ومن ثم فهي مستقلة عن العادات. والتقاليدء والثقافة. 
وامعرفة. والسياق )1995 (Porter‏ وعلى هذا النحوء فإن العلم عند ممارسته بشكل 
صحيح لا ينبغي أن يتلبس بأي دوافع سياسية أو أجندات خفية بحيث يمكن بعد ذلك 
أن تؤخذ البيانات على ظاهرها وعلاتها. وف الواقع تقترح المصطلحات المستخدمة عادة 
لتفصيل كيفية التعامل مع البيانات عمليات تقنية حميدة مثل: «الجمع». «الإدخال» 
«الترجمة» «التخزين» «اطمعالجة» و«التنقس» )2013 .(Gitelman and Jackson‏ ولذا 
فإن استخدامات البيانات هي التي تخضع للإملاءات السياسية. وبعبارة آخرىء إن الناس 
هم من يفسدون البيانات ويعملون على تجييرها لمصالحهم الخاصة» وليس للعلم lox‏ 


ذاتهك. 
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وبالنسبة لآخرينء فإن هذا الرأي لا مكن تبريره والدفاع «axe‏ إذ تتحذد طبيعة البيانات 
بفعالية من خلال الكيفية التي يمكننا بها تصور البيانات» وقياسهاء والتعامل معها. فبالنسبة 
لهم» البيانات لم تكن موجودة قبل إنتاجها؛ إلا أنها Y‏ تنشأ من العدم. ويتم إنتاج البيانات 
من خلال القياس.ء والتجريد والاقتباس.ء وتعميم التقنيات التي تم وضعها ضمن تصور 
لتنفيذ مهمة ما وتسجّل في الأشكال وامقاييس التي تتفق مع المعايير التي اخترعها الناس 
على سبيل JUL‏ النظام المتري. فالبيانات هي وحدات d,e‏ جعلت على نموذج du‏ 
لتمكين وإتاحة العمل sil‏ ,3( وقياس وتسجيل البيانات عن نفس الظاهرة من خلال 
العديد من الطرق والأساليب» التي يقدم كل منها مجموعة مختلفة من البيانات التي يمكن 
تحليلها وتفسيرها باستخدام وسائل مختلفة )1998 .(Poovey‏ فالكيفيات التى يتم إنشاء 
البيانات بهارلا يمكن حصرها نظرا لتعدد التصاميم والنقاشات والتغديلات التي تطرأ على 
البروتوكولات. والعملبات التنظيمية: ومعايير القياس: والفئاتء وا معايير الخاصة بالبيانات 
في ظل الفوضى المصاحبة لعملية توليد هذه البيانات وإنتاجها. فلو bisi‏ حالة قياس 
التعداد السكاني لبلد ما: فإن هنالك العديد من القرارات التي يجب أن تتخذ مثل تلك التي 
تحدد من يضاف للتعداد ومن يستثنى منه على سبيل «JUI‏ أن يشمل الزوارء والأجانب 
المقيمين بصورة مشروعة أو غير degia‏ وأولئك الذين يتجنبون المشاركة عن عمد أو Y‏ 
وما إلى ذلك.وأين يجب أن يتم تعدادهم ue‏ سبيل المثفال:تعدادهم les‏ لإقامتهم ليلة 
إجراء التعداد أو مكان إقامتهم الدانئمة في العادة؛ فجميع أنواع القواعد والإجراءات يتم 
وضعها قبل التعداد. ومع ذلك يظل هناك أمور لم يتخذ قرارات بخصوصها واختلاف عبر 
العدادين في طريقة التطبيق )1995 (Porter‏ 

ونتيجة U‏ فإن الكيفية المتبعة لتعريف البيانات وتحديدها وجوديا ليست عملية 
فنية محايدة. ولكن معايرة سياسية وأخلاقية يجري التنازع عليهاء ولها نتائج قابلة 
للتحليلء والتفسيرء والعمل في وقت لاحق )1999 .(Bowker and Star‏ ومع “US‏ 
8,1 أخرىء تعمل تبويبات البيانات على استبعاد التباينات والتقلبات وتحديد ما يتاح 
ويحجب داخل مجموعة البيانات» وعلى e£ JI‏ من «S‏ تكون هذه العملية من التقارب 
والاستقرار معرضة على الدوام للممانعة والرفض وإعادة الصياغة بسبب تعدد الجهات 
A 1e Ul‏ وامموضوعات والعمليات موضع امناقشة lg‏ والتناقض الحاصل ق البيانات 
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والذي لا مكن تطبيقه بسهولة وما يتناسب مع نظام ما )1999 (Bowker and Star‏ 
وعلاوة على ذلك. فإنه مجرد إنتاج البيانات يكون من الممكن فرزء وتقسيم» وتكعيب 
هذه البيانات بطرق متعددة في عدد من الفئات. وبعبارة أخرىء فإن البيانات ليست 
مستقله عن نظام الفكر والآدوات التي تدعم إنتاجها )1999 (Bowker and Star‏ فهذه 
النظم الفكرية مُطعَمة بافتراضات فلسفية ومعتقدات تمارس بشكل مختلف. فالواقع: 
وكما لاحظ )38 :2007( Borgman‏ أنه ق الوقت الذي يسعى فيه العلم إلى تصوير نفسه 
بالعالمية والعموم» تبدو ممارسات العلوم محلية ومتباينة على نطاق «gels‏ ومن ثم فإن 
البيانات لا تمثل ببساطة واقع وحقيقة العالم؛ فالبيانات هى وحدات بنيوية حول العام 
.(Desrosiéres 1998; Poovey 1998)‏ من هذا امنظور «يتم إنتاج المعرفة العلمية - 
بدلا من براءة اكتشافها» .)4 :2013 .(Gitelman and Jackson‏ كما ق التالی: 
إذا كان إنتاج البيانات عن طريق أداة مثل شبكة استشعارء فإن تفسير 

هذه البيانات يتظلب فهم الأداة - على سبيل JELI‏ ما الذي تستكشفه أجهزة 

الاستشعار؟ وتحت أي ظروف؟ وكم عدد تكرار مرات ال ملاحظة؟ ومع أي نوع 

من المعايرة؟ )183 :2007 .(Borgman‏ 


ومع ذلك نجد أن العلم يحاول في كثير من الأحيان جعل البيانات حرة ومستقلة 
عن مثل هذا الفهم السياقيء وتنظيم ومشاركة البيانات من خلال قواعد البيانات التي 
يجري التحسين فيها والتخفيف من حدة الفوضى عند إنشائها وحماية المستخدمين من 
.3,2 4 44$ إنتاج البيانات وتنظيمها )2013 «Js .(Gitelman and Jackson‏ بين 
Ribes and Jackson (2013: 165)‏ أن الاستخدامات العلمية OLLU‏ والقائمة على أنها 
محايدة وموضوعية هي مجرد تخيلات لا حقيقة لها؛ أنها «تفترض وتصور العام بناء على 
البيانات المتداولة دون النظر إلى مصدرهاء وحالتهاء وجوهرهاء وتاريخهاء ومن ثم تبرز 
هذه البيانات على أنها حرة للتنقل عبر العالم كعملة غير متمايزة وعالمية». فى المقابلء 
هما يؤكدان أن «البيانات هي أكثر ارتباطا من ذلك». 

ونتيجة cU)‏ فالبيانات غير مسبقة التحليلء وليست polis‏ موضوعية مستقلة. كما 
بينها )2 :2013( Gitelman and Jackson‏ متبعين في ذلك بوكر )2005( Bowker‏ عندما 
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ذكروا أن "السانات الخام ھی مصطلح متناقض؛ «فالبيانات هي على الدوام مطهوة 
سلفاء kg‏ تكن يوما lale"‏ بدا فهناك حاجة لتصور البيانات كما هي على الحقيقة في 
الوجود والعمل موحب ذلك )3 :2013 OLJ .(Gitelman and Jackson‏ - على 
Xo‏ سواء - هي اجتماعية من باب أنها تقع ضمن السياقء ومادية من باب أن لديها 
شكلا (كأرقام ثنائية: أو رموزء أو أعداد... وما إلى ذلك)» ويجري تخزينها على الورق» 
والأشرطة الممغنطة. والأقراص الصلبةء وما إلى ذلك Wilson 2011; Gitelman and)‏ 
.(Jackson 2013‏ كلا ا منظورين يعمل على تشكيل القواعد التأسسية «UU‏ فعلى 
سبيل «JUL‏ تعتمد البيانات الكبيرة على النقاشات الأخلاقية: والاقتصاديةء والسياسية في 
المجالات المختلفة التى تدعم البدء في اعتمادها وتنفيذها (انظر الفصل السابع)ء وتعتمد 
على قواعد البيانات» والحواسيب» والخوادم» وشبكات الاتصال التي تمكن بدورها عمليات 
إنتاج البيانات» ومعالجتهاء ومشاركتهاء وتحليلهاء تخزينها (انظر الفصل الخامس). وتسهل 
هذه 3L 3 Ja$L ugJl‏ التثانات (تعفتها)» وسوء تموظعهاء أو dL ao‏ أو كذ ةهاء أو تآكلها 
من خلال تلف الوحدة التخزينية للأرقام الثنائية - بت (أي تعطل وسائط التخزين نتيجة 
تحلل الأشرطة الممغنطة أو تضرر الأقراص الصلبة) )2013 .(Boellstorff‏ وف الواقع م 
تكن البيانات قط مطهؤة فقطء ولكنها أيضا منفتحة لتقبّل أساليب «غير مخطط لهاء وغير 
متوقعة» وعرضية»» و«متحولة Js Lab‏ شبة إنسانية معقدة» وطرق زمانية ناشئة لا تتبع 
على الدوام وصفة حسابية محددة مسبقا» )2013 (Boellstorff‏ 
ونظرا للطبيعة الاجتماعية وال مادية للبيانات» فإننا ننشط في إعادة صياغة وتشكيل 
«عواطنا اطاديةء والتقنية» والجغرافية»ء والتنظيمية: والاجتماعية إلى نوع من البيئات 
التي يمكن للبيانات أن تزدهر فيها... والوصول إلى العلاقة التكافلية مع البيانات» 
(Ribes and Jackson 2013: 152)‏ ومن 93« > وسنما ينظر إلى السانات بوصفها شتا 
i. 3 E‏ حول الواقع )2013 Shah‏ التأكيد «(Jue‏ فإن الفهم الأكثر إنتاجية 
للبيانات هو اعتبارها أحد مكوّنات الواقع وأحد منتجي الواقع في ذات الوقت. إن 
البيانات ليست محض فكرة تمثيلية مجردةء بل هي تأسيسية. وإنتاجهاء وتحليلهاء 
وتفسيرها له نتائج وعواقب تتبعها. وكما بين )2 :2013( :Gitelman and Jackson‏ 
«إذا كانت البيانات تخضع UJ‏ بطريقة أو بأخرىء فإننا نحن أيضا نخضع للبيانات». 
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ca‏ يتم م التقاط البيانات من العاطء ولكن ف المقابل تعمل في العام. إن البيانات م 
ds: 00‏ ولا مكن أن تكون. حميدة )2013 (Shah‏ بدلا من ذلك» من الضرورىي 
فهم «البيانات على أنها مؤطرة متأثرة بغيرها ومؤطرة مؤثرة على غيرها» Gitelman)‏ 
.(and Jackson 2013: 5‏ وبعبارة 2l‏ ,45 هناك حاجة إلى ما هو أكثر من مجرد 
الاعتراف العام من قطاعي العلوم والأعمال لأهمية التصور المفاهيمي للبيانات. 


التفكير النقدي حول قواعد السانات والبنى daxil‏ للسانات: 

I‏ العادةء يتم تجميع البيانات في مجاميع (Datasets)‏ في محاولة لفهم البيانات» والتي 
غالبا ما يتم تنظيمها وتخزينها في قواعد بيانات (وهي وسيلة لتنظيم وتخزين البيانات 
التي يمكن الاستعلام عنها بطرق متعددة) وبنى تحتية OLLU‏ مثل نظم ال محفوظات 
الآر شيفية (Archives)‏ وحاويات البيانات (Repositories)‏ (انظر الفصول الثاني والثالث 
والخامس). وكما كان الحال مع التصور ا مفاهيمي للبيانات بشكل cale‏ فمن المهم كذلك 
التفكير بشكل نقدي حول طبيعة قواعد البيانات والبنى التحتية للبيانات» وإنتاجها من 
الناحيتين الاجتماعية والتقنية (Socio-Technical)‏ وكيف أنها تعكس العقلانية حول 
العام في الوقت نفسه لأنها تتكاثر وتعزز هذه العقلانية. وكان هذا التفكير النقدي غائبا 
إلى حد كبير فيما يتعلق بالبيانات الكبيرة: والبيانات المفتوحةء والبيانات الصغيرة ds. oll‏ 

مع التركيز حتى الآن عليه ليكون ذا طبيعة تقنية وآلية بشكل أكبر. 

وتمتذ الفرضية ا مطروحة التي تم” تبنيها وتطويرها في جميع أنحاء هذا الكتاب من الحجة 
المبنية في القسم الأخيرء وهي الافتراض ob‏ قواعد البيانات والبنى التحتية للبيانات ليست 
ببساطة محايدةء أو وسائل تقنية لتجميع وتبادل البيانات؛ وليست بالتأكيد منتجات لتخزين 
البيانات الملتقطة عن العام» ولكنها حزم من العمليات الطارئة والمترابطة التي تقوم بتأدية 
الأعمال في العام )2011 .(Star and Ruhleder 1996; Kitchin and Dodge‏ انها أنظمة 
اجتماعبة juis‏ معقدة كامنة كجزء لا يتجزأ > ضمن المشهد المؤسساق SYI‏ من الباحثين: 
وامؤسساتء والشركات» التي تشكل أدوات "WM‏ في إنتاج المعرفة والحكم ورأس „JUI‏ 

ويتمٌ تصميم slug‏ قواعد البيانات على تقبّل أنواع معينة من البيانات وتمكين أنواع 
معينة من التحليلء ولذا فهنالك آثار عميقة مترتبة على الكيفية التي يتم بها هيكلتها على 
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الاستفسارات والتحليلات الممكن آداؤها؛ كما أن شروط صياغتها من شأنها أن تحدد العمل 
الذي ممكن القيام به عليها ومن خلالها )2012 (Ruppert‏ فعلى سبيل «JUL‏ يختلف 
تخزين البيانات في قواعد البيانات اختلافا تاما عن الشكل السردي من حيث ما 3& 423553 
وكيف يتم تخزينه» وكيف من ال ممكن استدعاؤها وإعادة استخدامها )2005 (Bowker‏ 
وينتج عن قواعد البيانات إهمال وتجاهل لبعض البيانات» إضافة إلى الثغرات الكامنة في 
البيانات» وذلك كلما تم الكشف عن علاقات بين البيانات وتوفير الإجابة عن بعض الأسثئلة 
التي يتعين الإجابة عنها؛ فهي تقيّد وتتيح من خلال وجودها (الأنطولوجيا)» وتنتج العديد من 
العلاقات في ذات الوقت الذي يتم فيه إخفاء علاقات أخرى )2013 (Ruppert 2012; Vis‏ 
واستنادا إلى Derrida‏ فقد جادل )12 :2005( Bowker‏ بأن قواعد السانات والمحفوظات 
الأرشىفة هي المتحكم :(jussive)‏ فهي "تقول UJ‏ ما نستطيع وما لا نستطيع أن نقوله" من 
خلال تحديد ما يمكن تذكره وما يجري تجاهله ونسيانه. فهذا التذكر والتناسي يتم تحديده 
في الأصل من خلال أنظمة وممارسات مبنية على قوانين سياسية وفلسفية. 

ومن هنا فإن التبويبات داخل قواعد البيانات غير ثابتة وغير طبيعية» ولكن يتم إنشاؤها 
من قبل جهات فاعلة ذات أهداف محددة تعمل ضمن مجتمعات الممارسة» أساليب 
الحوكمة» والقيود التقنية الفنية. ومن (e‏ فإن قواعد البيانات هى تعابير عن السلطة / 
المعرفه وهي تقوم بإقرار تشريعها وإعادة إنتاج هذه العلاقات )2012 (Ruppert‏ على 
سبيل «JUL‏ تحديد معدل التأمين لشخص ما أو ما إذا كان بإمكانه السفر بين البلدان. 
وعلاوة على «US‏ فإن قواعد البيانات هي كيانات ديناميكية متغيرة تقوم بإجراء «عملية 
مستمرة من التمييز والتفريق» )129 :2012 (Ruppert‏ من خلال التفاعل مع مجاميعها 
المرتبطة بها (المنشئونء المستخدمون: «oaa JI‏ الأجهزةء الشبكات» وما إلى ذلك). 

s‏ الوقت نفسه. عملت قواعد البيانات على فصل عملية تحليل البيانات عن البيانات 
نفسها من خلال تمكين إجراء استعلامات وحسابات معقدة دون الحاحة إلى إجراء هذه 
التحليلات التي تتطلب الاطلاع والعمل مع البيانات نفسها أو حتى فهم الكيفية التى 
تم من خلالها تجميع البيانات وتنظيمها )2013 .(Gitelman and Jackson‏ وقد تم 
تعزيز هذا الفصل من خلال اليات مثل التوحيد العياري (Standardization)‏ للصيغ 
والبيانات الوصفية والتعامل مع البيانات دون النظر إلى السياق الواردة فيه وبعيدا عن 
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التأثير السياسي )2011 (Wilson‏ والأهم من ذلكء فإن هذا الفصل والتحرير للبيانات 
قد مكن السلطة / المعرفة المتعلقة بقواعد البيانات من الانتقال والانتشار وليتم توظيفها 
من قبل الآخرين بعيدا عن الأعمال الداخلية المعقدة فيها وتاريخها وسياسة الإنتاج لها 
(بالطريقة نفسها التي يستفيد فيها السائق من السيارة من دون معرفته LAS‏ صنع كل 
أنظمتها المعقدة أو ماذا تعمل أو كيفية تفاعلها لتشكيل تجربة القيادة). ومن ثم مكن 
للباحثين الاستفادة من قواعد البيانات الحكومية مثل التعداد السكاني أو المسح التجاري 9l‏ 
المؤشرات الاقتصادية دون معرفة الدوافع السياسية لم وكيف تم بناء قواعد البيانات» أو 
الجوانب الفنية لإنتاجهاء أو وجود الألفة الشخصية مع الظواهر الملتقطة. على سبيل المثال» 
استخدام الوزارة الإيرلندية للبيئة لقواعد بيانات عقارية غير مكتملة في آيرلندا في مرحلة 
ما بعد الانهيار الاقتصادى 2008 (متوفرة على الرابط: 


(http://www.housing.ie/OurServices/Unfinished-Housing-Developments.aspx 


حيث كان للمرء أن يجري «Sol‏ والتصورء والاستخلاص للنتائج حول العقارات 3 
إيرلندا دون أي معرفة مسبقة عن تاريخ وسياسات المسح. وكيف تم القيام به. ودون زيارة 
أي من تلك العقارات (انظر .(Kitchin et al., 20122, b‏ فمثل هذا التحرير والفصل مكن 
من العمل مع قواعد البيانات على أنها غير متغيرة ومستقرة وقابلة للتحول والنقل عبر 
المكان والزمان )1989 (Latour‏ 

وتستضيف البنى التحتية للبيانات قواعد البيانات وتصل بينها لتشكل بنية تقنية 
à ael‏ ]$$ تعقيدا. وكما هو الحال مع قواعد البيانات» لا يوجد شىء كامن أو معطی 
حول كيفية تكوين هذه الهياكل الأرشيفية والتشاركية. وف الواقع» وكما نوقش في جميع 
أنحاء الكتاب» تعرّض تصميم وإدارة البنى التحتية للبيانات إلى تحديات تقنية وسياسية تم 
التصدي لها من خلال نقاشات فوضوية ومفاوضات عبثية تمت ف سياق أتصف بالعديد 
من الأجندات (جداول الأعمال) والقولبة الحكومية. فالحلول التي تم إيجادها والمتعلقة 
بالمعاييرء والبروتوكولات» والسياسات» والقوانين كانت بطبيعتها ذات آثار تقريبية كونها 
هدفت إلى تثبيت أرضية مشتركة وتعميم ال ممارسات ونشرها بين المطورين والمستخدمين 
(Lauriault 2012)‏ والتمويه على وتخفيف حدة التوتر والتباين بين قابلية الاستخدام 
وإتاحته والحد من التخصيص وتقييد الابتكارء ومنع الطرق البديلة لهيكلة وترتيب البيانات 
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.(Star and Ruhleder 1996)‏ وبالنظر إلى حدة التوترات» ينبغي التأكيد على عمليات 
التقريب باستمرار وبشكل متكرر من خلال التطبيقء والإدارةء وأنظمة الحوكمة Star and)‏ 
.(Lampland, 2009‏ لذلك» أكد 112 :1996( Y» æl (Star and Ruhleder‏ وجود لمركز 
مطلق يصدر dio‏ التحكم وا معايير؛ وكذلك. لا أطراف مطلقة ... مع كون البنية التحتية 
شىء ظاهر للناس ف الممارسة العمليةء ومتصلا بالأنشطة والهياكل». 


فهذا الظهورء وعلى e£ JI‏ من عدم تركزه بشكل کامل» ليس شكلا حرا وهو يتشكل 
من خلال علاقات dgs‏ واسعةء فقد حادل(2001) LJ! ob Graham and Marvin‏ 
التحتية هي تأسيسية نتيجة «تراكمات بعيدة المدى من التمويلء والتكنولوجياء والدراية 
والسلطة التنظيمية والجيوسياسية» (ص. 12) والمحافظة على «الهندسة الفنية الاجتماعية 
للسلطة» (ص. 11) من المصالح الاجتماعية المتحجرة. وتشمل هذه التراكمات أنظمة من 
التشريعات تسعى من الناحية القانونية ومن خلال أشكال الحوكمة لتحديد كيفية إدارة 
وتحليل ومشاركة البيانات» على سبيل JELI‏ قوانين حماية البيانات (انظر الفصل العاشر). 
ولذلك» اقترح )8 :1987( Starr‏ أن البنية axil‏ للبيانات لدنها: 

نوعان من الهياكل التنظيمية - الاجتماعية والمعرفية: فالتنظيم الاجتماعي يتكون من 
العلاقات الاجتماعية والاقتصادنة لأفراد العينة الممثلة: وأجهزة الدولةء والشركات الخاصة: 
واطمنظمات المهنية والدولية: وغيرهم من المشاركين ف إنتاج تدفقات البيانات من مصادرها 
الأصلية وحتى نقاط التحليل» والتوزيع: والاستخدام: في حين يشير التنظيم ال معرفي لهيكلة 
البيانات نفسهاء Le‏ في ذلك حدود الاستعلام» والافتراض عن الواقع الاجتماعى» وأنظمة 
التصنيف. وطرق القياس» والقواعد الرسمية لتفسير وعرض البيانات. 

كما أكد )2007( Dourish and Bell‏ أنه لا مكن النظر بصورة صرفة لقواعد البيانات 
والبنى التحتية كوسائل وأدوات ثانوية لأنها تشمل بطبيعتها نواحي ثقافيةء واقتصادية: 
ومعرفية» وهي غارقة في الأهمية على المستوى الاجتماعي. ولذلك اقترحا منظورين يمكن 
من خلالها فهم البنى التحتية للبيانات: المنظور الأول يتضمن قراءة اجتماعية سياسية 
يدرس من خلالها «بلورة العلاقات المؤسسية» (ص. 416). أما المنظور الثانى فهو القراءة 
التجريبية التي تدرس " كيفية تشكيل البنى التحتية للبيانات لإجراءات الأفراد وخبراتهم" 


01 ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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(ص. (£V‏ وف EIS‏ الحاتينء تفهم البنى التحتية للبيانات ككيانات مترابطة. ويعيد هذا 
الترابط تشكيل العالم بشكل عرضي بناء عليهاء وهي بدورها تتشكل من قبل العالم كذلك. 
ولي نصل إلى استخدام قواعد البيانات والبنى التحتية للبيانات والاعتماد عليها لفهم 
العام والقيام بأعمال فيه» فإن ممارساتنا المنطقية والمادية تتكيّف وتتمحور كاستجابة لهما 
.(Star and Ruhleder 1996)‏ ولا ينعكس العا في البيانات فقطء بل يتغير بها؛ «فالعمل 
على إنتاج وحفظ وتبادل السانات ومشاركتها يقوم بإعادة تتشكيل العوام dus dA JI‏ 
والتكنولوجية. والثقافية من حولهم» )147 :2013 (Ribes and Jackson‏ 

وبعبارة 45,51 لا تدعم قواعد البيانات والبنى التحتية للبيانات البحوث ببساطة 
ولكنها تغير وبشكل جذري الممارسات والنظم البحثية - الأسئلة المطروحةء وكيفية طرحهاء 
وطريقة dale d ale VI‏ وكيفية تطبيق الإجابات» ومن يجري البحث وكيفف يعملون بصفة 
باحثين (انظر الفصل الثامن). فعلى سبيل «JUL‏ وف دراستها لتطور التعداد aS JI‏ 
الكندى وأطلس كنداء ببّنت )2012( Lauriault‏ بالتفصيل كنف تطور كل تعداد بشكل 
متواتر ومتكرر على أساس نماذج للعالم شكلت Byb‏ لتصور وعرض كندا. وقد جادلت بأن 
محفوظات البيانات والبيانات نفسها تشكل «نظام ذاكرة خارج الجسم المؤسسي يسمح 
بسرد قصص عن طبيعة كندا... من خلال الخرائط والرسوم البيانية والنماذج والإحصاءات 
التي تعتمد على أجهزة الاستشعار.ء والبيانات» وقابلية التشغيل البيني» ومعايير رسم 
الخرائط على شبكة الإنترنت» والبوابات الإلكترونية» والبيانات الوصفية والنماذجء والعلوم 
والهياكل المفتوحة» (ص. .(YV‏ ف الممقابلء تعدل هذه القصص النماذج الأساسية ومن ثم 
البنية التحتية للبيانات» مما يعمل على تحوير الوسائل التي يتم من خلالها إنشاء القصص. 

ويتطلب تفهّم قواعد البيانات والبنى التحتية للبيانات التفكيك والتفريغ بعناية لطبيعة 
نشوتهاء وتداخلهاء وعلائقیتهاء وسياقيتها )1996 .(Star and Ruhleder‏ وهذا يعني البحث 
فيما وصفه )34 :1999( Bowker and Star‏ بأنه انتعكاس Infrastructural) xL i‏ 
(Inversion‏ أي أن ندرك أعماق الترابط بين الشبكات التقنية sols lg‏ الفنية. من digo‏ 
والعمل الحقيقي للسياسة وإنتاج المعرفة من جهة أخرى. وكما .Lauriault (2012) c5‏ 
فإن هذا يتطلب أيضا تحليلا تاريخيا Gy‏ كيف تتطور قواعد البيانات والبنى التحتية 
للبيانات مع مرور الوقت وتغير QUA‏ 
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: (Data Assemblages and the Data Revolution) مجاميع البيانات وثورة البيانات‎ 

كان الجدل والحجة الرئيسية ال معروضة في هذا الفصل بان التفكير بالبيانات لا يكون 
بالطريقة المماشرة: ولا مكن أن توجد البيانات بشكل مستقل عن الأفكارء والآليات. 
والتقنيات» والنظم» والناس» والسياقات» بغض النظر عن كونها في كثير من الأحيان يتم 
تصورها بهذه الطريقة )2013 .(Lauriault 2012; Ribes and Jackson‏ فالبيانات يتم 
إنشاؤها بوصفها نتاجا لكثير من العقول العاملة في مختلف الحالات والأوضاع» وهى مؤطرة 
وتتشكل في ظروف وهياكل مختلفه. 

ولذافإن من طرق فهم البيانات هو التفكير بها كقضية مركزية لتجمّع فنى 
اجتماعي معقد. ويتكون هذا التجمع للسانات من العديد من الأدوات dd‏ 
التي تزداد تشابکاء وتطوزاء وتتحوّر مع مرور الزمن وتبدل المكان (انظر الجدول1-3). 
وتصوغ كل أداة di gouan‏ بعناصرها ما هو ممكنء وما هو.,مظلوب. وما هو متوقع 
من البيانات. سلس mE NY‏ 
من خلال شبكة معقدة ومتغيرة من العلاقات المتعددة الأوجه (انظر الشكل 3- 
وكما اذعى JS‏ من )2013( Ribes and Jackson‏ فإن هذه الأدوات لا تقوم p^‏ 
ماهية وكيفية إنتاج البيانات وإلى أي حد من الممكن توظيفها فحسب. ولكنها بحد 
ذاتها منظمة ومدارة لتقوم بإنتاج مثل هذه البيانات. وعلى US‏ فإن البيانات 
ومجاميعها تتشارك التحديد (Co-determinous)‏ وتتىادل عملية التشكيل كل منها 
للآخر(00115]1611660) (Mutually‏ وترتبط سعضها من خلال مجموعة من الممارسات 
والعلاقات المنطقية والمادية الطارئةء والعلائقيةء والسياقية. وعلى ذلك يختلف كل 
تجميع للبيانات في نسق ترتيب العناصر وسياقهاء ولكنها تتشارك في قواسم مشتركة 
وتأثير كل منها في الآخر بسبب اعتماد الأدوات على بعضها وتداخلها والاتفاقيات التي 
تغطي مجاميع البيانات» ومع نشوء أفكار ومعارف جديدة: واختراع التقنيات» وتطوير 
المهارات» وانفتاح الأسواقء فإن مجاميع البيانات تتطورء وتتحوّرء وتندمج» وتتفكك. 
ونتيجة لذلكء. هناك تنوع كبر من تجمعات البيانات عبر النطاقات والاختصاصات 
امختلفة. 


O^‏ ثورة البيانات البيانات الكبيرة» والبيانات ال مفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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جدول رقم (V-Y)‏ 
الأدوات والعناصر مجاميع السانات 


العناصر 

طرائق التفكير. الفلسفيات. النظريات» النماذج الإيديولوجيات» 
امنطقيات.... إلخ. 

النصوص البحثية: الأدلةء ا مجلات» المواقع الإلكترونية: الخبرة» الخطب» 


منتديات الدردشة.... إلخ. 


السياسة» الأنظمة الضريبية» الرأي العام والرآي السياسيء الاعتبارات 
الأخلاقية»... إلخ. 













معايير البيانات. صيغ الملفات. متطلبات النظم» اللوائح البروتوكولية؛ 
القوانين» الترخيصء أنظمة الملكية الفكرية.... إلخ. 
الأوراق / الأقلام» الحاسبات الآليةء الخدمات الرقمية: أجهزة الاستشعارء 
اماسحات الضوئية: قواعد البيانات» شبكات الاتصالء الخوادمء... إلخ 












التقنيات» طرق التنفيذء السلوكيات المستفادة. الاتفاقيات العلمية.... إلخ. 
سجلات الأرشفة: الشركات» مستشارونء ا مصنعون:ء بائعو التجزئة: الجهات 
الحكومية» الجامعات. المؤتمرات» النوادي والمجتمعات,. واللجان والمجالس» 
Olga‏ اممارسة.... إلخ. 
aGUSU 9. oa‏ القثمون S ERT ERT S Pa REPA Je‏ 59« العلياء. 
السياسيونء المستخدمون. المواطئون.... إلخ. 





المختبرات. المكاتب» مواقع العمل مراكز البيانات» مجموعات الخوادم: 


مجمعات الأعمالء... والقوى البشرية المتصلة بها. 


للسيانات: وطمشتقاتها (على سبل «JUL‏ النصوصء الجداولء؛ اللمخططات» 
الخرائط)ء وام محللون»ء وبرمجيات التحليلء والتفسيرات.... إلح. 





ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها o4‏ 
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فهذا الكتاب يبحث ف تجمعات البيانات الناشتةء والمتطورة: المنتجة للبيانات ال مفتوحة. 
والبنى التحتية للبيانات» والبيانات الكبيرة» وللقيام بذلك يطرح الكتاب ثلاث مسائل رئيسية 
للمناقشة: أولاء هناك حاجة لتطوير طرق مبدئية وفلسفية لفهم البيانات. فهناك نقص 
ملحوظ في التفكير النقدي والبحثي عن البيانات وق السانات بحد ذاتها من حيث التكوين 
والتشغيل للمجاميع المحيطة بهاء وعلى الخصوص با مقارنة مع التركيز والاهتمام اللذين 
تحظى به مفاهيم ال معلومات وا معرفة. وذلك على الرغم من ان البيانات هى عنصر اساسى 
في إنتاج المعرفة. ثانياء هناك ثورة بيانات جارية تعمل على تشكيل لحظة حاسمة في تطور 
وتحوّر تجمعات البيانات. ونظرا لالتقاء العديد من التطورات الناشئة ف مجال الحوسبةق 
والتقنيات المنهجية: والمجالين السياسي والاقتصاديء فإن حجم البيانات» وتنوعهاء وسرعتهاء 
ودقتهاء وتوافزها والكيفية التي يتم بها فعالجة البيانات وتحليلقنا agis‏ وتوظيفها 
لزيادة aJ!‏ وتحصيل القيمة. قد شهد bois Js od‏ ثالث m‏ لختلف التحديات 
التقنية والأخلاقية والعلمية التي أثارتها ثورة «OLI‏ فإن هناك حاجة ملحة لتطوير فهم 
مفصل لتجمعات البيانات الجديدة والناشئه التي يتم إنشاؤهاء ولذا تهدف الفصول العشرة 
التالية إلى توفير نظرة إجمالية على نطاق واسع» وشاملء ودقيق لهذه التجمعات وتسليط 
الضوء على القضايا التي تتطلب TP‏ من الاهتمام والبحث. 


M.‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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الفصل الثانى 
السيانات الصغيرة (Small Data)‏ والبنى التحتية للسانات 
«(Data Infrastructures)‏ ووسطاء السيانات (Data Brokers)‏ 


قبل بضع سنوات مضت كان مصطلح «البيانات الصغيرة» نادر الاستخدام, إن م يكن 
RP‏ وقد ذاع انتشاره PATAR‏ بحكم الواقع على النقيض مما سمى «البيانات الكبيرة». 
فكل البيانات كانت في الواقع بيانات صغيرة ومن ثم لم تتطلب تمييزها بهذا Fe‏ 
وسيجري لاحقا مناقشة ما قام على تأسيس البيانات الكبيرة بالتفصيل ف الفصل الرابع 
ولكن من الضروري تسليط الضوء على الفرق بين البيانات الصغرة والبيانات الكبيرة. وذلك 
قبل التوجه إلى مناقشه LAS‏ تحول البيانات الصغيرة من خلال الىنى التحتية الجديدة 
للبيانات والأسواق SAALI‏ ببلايين الدولارات» كما سيتم لاحقا في الفصل التالى مناقشة 
انفتاحها لتقبل المشاركة وإعادة الاستخدام. 

فمن الناحية التقليدية: ونظرا للتكاليف والصعوبات المصاحبة لعمليات إنتاج ومعالجة 
وتحليل وتخزين البيانات» فقد تم إنتاج البيانات الصغيرة بطرق مضبوطة بأحكام باستخدام 
تقنىات أخذ العينات التى تحد من نطاقهاء وصلاحيتها الزمنية؛ وححمها )2010 (H.J. Miller‏ 
ius‏ ممكن أن تكون بعض قواعد البيانات كبرة le‏ في الحجم» مثل قاعدة بيانات التعداد 
الوطني» ولجعل ممارسة تجميع هذه البيانات قابلة للإدارةء فإن عملية إنتاجها عادة ما تتم 
خلال بضع سنوات وتكون محدودة å‏ النطاق (في حالة التعداد. يجرى في العادة مرة واحدة كل 
عشر سنوات ويكون مقتصرا على ثلاثين إلى أربعين سؤالا فقط). وعلاوة على «US‏ فقد كانت 
دقة البيانات الصغيرة العامة (Small Tertiary Data)‏ في كثير من الأحيان ضعيفة la‏ (كانت» 
على سبيل «JULI‏ على مستوى ال مقاطعات أو الدول وليس الأفراد والأسر)ء كما أن JL UI‏ 
المستخدمة لإنتاجها غير مرنة على الإطلاق (على سبيل «JE‏ من ال مستحيل تعديل الأسئلة أو 
الإضافة لها أو الإزالة منها مجرد التهيئة للتعداد وإعداده والبدء بإدارته لأن ذلك سينعكس 
LL.‏ ويشكل جدى على القدرة على المعالجة والتحليل). وف المقابلء تتميز البيانات الكبيرة 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها Ww‏ 
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الرابع). 
جدول رقم (١-؟)‏ 
مقارنة السانات الصغيزة والساتات الكبيرة 
محكمة وقوية 
قويه 
سريعة» مستمرة 
واسعة 





المرونة وقابلية التوسع 


' 
E: 


35 الوقت الذي تعد فيه البيانات الصغيرة واحات صغيرة ضمن صحارى البيانات» 
تنتج البيانات الكبيرة طوفان بيانات حقيقي. وقد آذى ذلك بالبعض إلى التساؤل عما là]‏ 
كانت البيانات الكبيرة قد تؤدي إلى زوال البيانات الصغيرة أو تضاؤل مكانة الدراسات التي 
تعتمد على البيانات الصغيرة نظرا لمحدوديتها في الحجم» والنطاقء والصلاحية الزمانية. 
فقد لاحظ )2008( Sawyer‏ أن وكالات تمويل البحوث الأكادمية: على سيل «JU‏ توجه 
موارد التمويل المحدودة الخاصة بها إلى مجالات السانات الغنية على نحو متزايد. وذلك 
رها بسبب التداخل بين حجم البيانات وسرعتها مع مقدار التبصر والتوظيف والقيمة؛ 
وأن هذه الوكالات تحول الأسئلة البحثية التي من الصحعب أن تنتج بيانات كبيرة لجهات 
التمويل الأخرى المتعددة وتمنحها وضع هامشي داخل وخارج هذه المؤسسات الأكادمية. 


التمويل نحو البحوث التجريبية التطبيقية ذات الشراكة الصناعية. وقد أدى إعادة الترتبب 
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لأولويات البحث إلى سوء الفهم لطبيعة البيانات الكبيرة وقيمة البيانات الصغرةء فالبيانات 

الكبيرة رما تهدف إلى أن تكون شاملة: ولكن كما هو الحال مع جميع البيانات فإن كليهما 

عبارة عن تمثيل (Sample) dusg (Representation)‏ فماهية البيانات التي يتم التقاطها 

Id‏ في الواقع من خلال التالى: 

٠‏ مجال إطار عرض/ أخذ العينات (حيث يتم توظيف أجهزة التقاط البيانات وماهية 
إعدادات التهيئة لها/ ومعاملاتها؛ مثل من يستخدم المكان أو وسائل الإعلام» وعلى سبيل 
JULI‏ من الذي ينتمي إلى وسيلة التواصل الاجتماعي الفيسبوك أو يتسوّق في محلات 
وول مارت...إلخ). 

o‏ التقنية والمنصة المستخدمة (المسوحات المختلفةء وأجهزة الاستشعارء والعدسات» 
«dua! SL Jl ls‏ وا ملخططات والتصاميم... e la lS 9 «eJ‏ فروقا وتباينات Lalo à‏ 
البيانات التي يتم إنشاؤها). 

dL uu Lila السياق الذي يتم إنشاء السانات فيه (الأحداث الجارية تعنى أن البيانات تقع‎ o 
إلى الظرف الذي تقع فيه).‎ 

e‏ تبوسات (أنطولوجية) السانات ال مستخدمة (كيفية معايرة السانات وتصنيفها). 

٠‏ البيئة التنظيمية فيما يتعلق بالخصوصيةء وحماية وأمن البيانات. 


وتلتقط البيانات الكبيرة في العموم ما هو سهل التقاطه - أي البيانات التي يتم التعبير 
عنها علنا (ما كتبء > وَمُرّر ومُسح ضوئياء وما تم استشعاره... إلخ؛ وتصرفات الناس وسلوكهم؛ 
وحركة الأشياء) - وكذلك البيانات المستنفذة والتى هى ناتج وظيفة رئيسية وليست ال مخرج 
الرئيسيء» والبيانات الوصفية التي تمّ إنشاؤها تلقائيا. وتأخذ البيانات الكبيرة هذه البيانات 
بالقيمة الاسمية: على الرغم من أنها قد لا تكون قد تم تصميمها للرد“ على أسئلة محددة 
والبيانات الناتجة قد تكون عشوائية وغير دقيقة (انظر الفصل التاسع). 

أما البيانات الصغيرة فقد تكون محدودة في الحجم والسرعة» ولكن لديها تاريخا طويلا 
من التطويرء مع منهجيات مقررة وأطوار للتحليل» وسجل حافل من الإجابات الناتجة للأسئلة 
العلمية. ويممكن لدراسات البيانات الصغرة أن تكون مصممة بشكل أفضل بكثير للرد على 
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أسئلة بحثية محددة والاستكشاف المفضل وال معمّق للطرق المتنوعة: والسياقية: والمنطقية 
وغير المنطقية التي يتعامل بها الناس» ويتم فهم العام بهاء وكيفية عمل العمليات العلمية 
(انظر الفصلين الثامن والتاسع). ويمكن أن تركز البيانات الصغيرة على حالات محددة وتخر 
عن قصص فردية» وسياقيةء ودقيقة. وبسبب أنها تستهدف ظاهرة معينة» فهي تركز بشكل 
مكثف على قضية وعادة ما تكون أقل حاجة للموارد بشكل مكثف: وتسعى دراسات 
البيانات الصغيرة على التنقيب عن الذهب من خلال العمل في شق ضيق للغايةء في حين 
تسعى دراسات البيانات الكبيرة إلى استخراج شذرات من خلال التعدين في حفرة مفتوحة 
وشفط وغربلة مساحات شاسعة من الأراضي. ومن ثم فقد برهن )2008( Sawyer‏ على أن 
التمويل يحتاج إلى استهداف الإجابة عن الأسئلة الحرجةء سواء كانت معالجتها باستخدام 
بيانات صغيرة أو كبيرة» وليس مجرد أن توجّه نحو المشاريع التي يمكنها الوضول إلى كميات 
هائلة من البيانات على أمل أنها تحوي بطبيعتها رؤى وأفكارا مفيدة. 

وهكذاء يمكن القول إنه من الممكن تحصيل المزيد من القيمة والرؤى من البيانات 
الصغيرة من خلال توسيغ نطاقها إلى مجموعات بيانات أكبر. وجعلها متاحة لإعادة 
الاستخدام من خلال البنى التحتية للبيانات الرقمية والتي تجعلها إضافة إلى ذلك قابلة 
لمختلف أشكال التحليل الحسابيء والحفاظ عليها للأجيال القادمة. ونتيجة لذلكء؛ وكما هو 
الحال مع البيانات الكبيرةء فقد استثمرت موارد كبيرة في السنوات الأخيرة لإنشاء مثل هذه 
البنى التحتية للبيانات» والتي أحدثت تغييرات كبيرة في مشهد البيانات. 


حاويات السانات «(Data Holdings)‏ محفوظات السانات (Data Archives)‏ 
والبنى التحتية :(Data Infrastructures) SULU‏ 
كم جم البيانات معا وتغزيتها لقارة طويلة من ju Jl‏ لبجل وقد كانت هذه 
الممارسات غير رسمية ورسمية على حد سواء في طبيعتهاء فالممارسات غير الرسمية تتكون 
ببساطة من جمع البيانات وتخزينهاء في حين تتكون الممارسات الرسمية من مجموعة 
اممارسات الفاعلة ذات العلاقة بإدارة 8L özgə‏ السانات (Data Curation)‏ والصساكل 
المؤسسية المصممّة لضمان الحفاظ على السانات من أجل الأجيال القادمة. وقد يكون من 
الأفضل وصف اممارسات غير الرسمية بأنها حاويات البيانات» في حين أن الممارسات الرسمية 
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هي محفوظات (أرشيفات) البيانات. ويجري» في كثير من الأحيانء الخلط بينهما أو تستخدم 
بالتبادلء جنبا إلى جنب مع غيرها من ا مصطلحات مثل النسخ الاحتياطي (Backup)‏ 
وبنك ا معلومات (Information Bank)‏ ومستودع البيانات «(Data Repository)‏ ولكن 
المحفوظات الأرشيفية تمتلك خصائص مميزة as:‏ عند أمناء المحفوظات (Archivists)‏ 
el‏ 

فالمحفوظات هي مجموعات رسمية منظمة من البيانات التي يتم هيكلتها وتوتيقها 
ونشرها بشكل «Jis‏ مصحوبة بالبيانات الوصفية المناسبة لهاء مع التخطيط الفعّال لقضايا 
امحافظة Ue‏ وإتاحة الوصول U Jl‏ وإمكانات اكتشافها )2013 .(Lauriault et al.‏ 
فا محفوظات تهدف بشكل واضح وصريح وطويل الأمدء للحفاظ على البيانات لإعادة 
استخدامها في المستقبل. إن مفهوم الحفاظء في هذا السياق» لديه استخدام خاص محدد على 
أنه مجموعة ilga‏ طة ylik‏ والمدعمّة «بالمبادئ. التشاسات. القواعد والاشتراتيجيات 
الرامية إلى إطالة أمد الكائن (البيانات) من خلال المحافظة عليه ف حالة مناسبة للاستخدام 
سواء على شكله الأصلي el‏ في شكل مُستدام أكثر ثباتاء مع الإبقاء على الشكل الفكري 
للكائن» )2013 ,2 .(InterPARES‏ ويسعى الأرشيف للحفاظ على مجموعة سجلات كاملة: 
وليس مجرد البيانات؛ آي أنها تشمل كل الوثائق الداعمة والبيانات الوصفية وغيرها من 
ا مواد ذات الصلة التي تحتوي على تفاصيل المنشأ والسياق فيما يتعلق بكيفية إنتاج البيانات 
والطريقة التي ينبغي أن تعامل وتحلل وتفسّر بها. فالنهج gabl‏ في الحفاظ على البيانات 
مبني على الإدراك التام بأن التقنيات والبروتوكولات واطبادئ التوجيهية لأفضل الممارسات 
هي عرضة للتغيير والتقادم» بمعنى أن البيانات سوف تحتاج للتنقل والترحيل عبر منصات 
وتقنيات بسبب الابتكارات الجديدة التي 3b‏ في السياقء كما يدرك النهج المتبع db‏ دون 
ممارسات فعالة لإتاحة وإعادة الاستخدام والمشاركة للبيانات فإن البيانات معرضة للتلف» 
او الضياع. أو الحرمان من بياناتها الوصفية السياقية والوثائق الداعمة );2007 Borgman‏ 
.(Dasish 2‏ ويسعى المحفوظ الأرشيفي إلى توفير موارد جديرة بالثقة. من خلال الحفاظ 
على سلامه البيانات (Data Integrity)‏ مع مرور الوقت. 

وف بعض الحالات» قد يلزم مؤتمنو البيانات (Data Custodians)‏ مسؤولية قانونية 
لحفظ وأرشفة البيانات بشكل مناسب لإعادة الاستخدام الحالي والمستقبلي. كما قد يكون 
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المؤتمن على الأرشفة والقائم عليها نفسه سلطة قانونية تشريعية. فعلى سبيل «JUI‏ 
فإن ال محفوظات الأرشيفية الوطنية والوكالات الإحصائية الوطنية هي الكيانات القانونية 
التي عهد إليها جمع وإنتاج وأرشفة قواعد بيانات محددة مثل السجلات الشخصية 
للأفراد والحسابات القومية» والتعدادات والمسوح السكانية. وينبغي أن تمتثل ا محفوظات 
أيضا للتشريعات المتعلقة بحقوق الوصول إلى البيانات» والخصوصية. والمبادئ الأخلاقية 
وحقوق الطبع والنشرء والملكية الفكريةء وتحديد المسموح لهم للوصول إلى البيانات وما 
يمكنهم القيام به من خلال تحديد الصلاحيات على البيانات. على سبيل ال مثالء في العديد 
من البلدان» من ا ممكن نشر سجلات التعداد في شكل إجمالي. مع تقييد نشر السجلات 
الشخصية إلى ما بعد مئة cele‏ فالالتزام بإتاحة الوصول وإعادة الاستخدام للبيانات لا يستلزم 
بالضرورة العمل على نموذج مفتوح (انظر الفصل الثالث)ء ولكن ينبغي أن يتم ضمان توافر 
البيانات في المستقبل للمجتمع ا مستهدف بطريقة قانونية )2012 .(CCSDS,‏ إن المجتمع 
المستهدف هو عادة مجموعة معينة من العلماء أو المتخصصين في مجال السياسات الذين 
لديهم في العادة اختياجات مخددة تماما من البيانات» ومتطلبات وظيفية وذغم مما يعنى 
أن حلول الأرشفة العامة ستكون ذات فائدة محدودة )2013 (Lauriault et al.‏ 

ومن ثم» فإن محفوظات البيانات ليست مجرد مخازن بيانات أو أنظمة نسخ احتياطي 
(والتي تحفظ البيانات في حال حدوث أعطال على المدى القصير مثل عطل الوسط التخزيني 
أو الفشل التقني). ولكنها ehhis‏ وتنسّقء وتثدارء وثوظف بفعاليه من قبل موظفين 
متفرغين ومتخصصين يعملون على إضافة القيمة وضمان الاستمرارية. فهؤلاء الأفراد. إضافة 
إلى الكيان الإداري الوظيفي» مسؤولون عن الأرشفة إضافة إلى ثلاث مجموعات أخرى من 
الأطراف الفاعله تي idae‏ الأرشفة وهم: منتجو البيانات» ومستهلكو البيانات» والإدارة 
.(CCSDS 2012)‏ فالمنتجون هم منشئو البيانات أو الكيان القانوني ال مسؤول عن إنتاجها؛ 
Ul‏ المستهلكون فهم مستخدمو ال محفوظات: وأصحاب المصلحة المعنيون بها أو مجتمع معين؛ 
Lala‏ الإدارة فهي الهيئة التي تشرف على العمليةء .3539 للأرشف مىثاقا ونظاقا: ولكنها لا 
تأخذ bas‏ ذش à là‏ عمليات الأرشفة اليومية )2013 (CCSDS 2012; Lauriault et al.‏ 
وتشكل هذه الدوائر مجتمعة كيفية بناء وتشغيل وتطوير الأرشيف مع مرور الوقت. 
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في امقابلء فإن حاويات البيانات هو مجموعة غير رسمية وغير نظامية من البيانات. 
وقد يعتد بعض منتجي البيانات أن النسخ الاحتياطي أو أنظمة التخزين تشكل محفوظات 
أرشيفية بحكم الواقع» ولكنها تفتقر إلى الجهاز المؤسسي.ء والتنظيم: والسياسات الرسمية 
النظامية (بالنسبة إلى المعاييرء وإتاحة الوصول إليهاء وإمكانية إعادة استخدامهاء وحقوق 
الملكية co SI‏ والمعايير الأخلاقية: وإلى آخره)ء وما يطمح إلى تحقيقه الأرشيف Lauriault)‏ 
.(etal. 3‏ فقد تكون حاويات السانات منتظمة وموحهة» ولكن بدون قواعد صارمة 
أو أي خطط طويلة المدى تتعلق بالمحافظة على البيانات وحفظهاء ودون أي التزام لمشاركة 
البيانات وتبادلها أو جعلها متاحة لإعادة الاستخدام. وعلى الرغم من أن حاويات البيانات 
قد تلتزم بشكل جيد بمعايير البيانات المتوقعة: إلا أن هذا الالتزام يفتقر إلى الاعتماد 
والمصادقة عليه ويفتقر إلى الوثائق الأخرى والبيانات الوصفية المناسبة. 

وقد فقدت معظم البيانات التي 3 إنتاجها على مر التاريخ أو Ca»‏ بسبب تخزينها 
ف حاويات بيانات] ولس أزشيفا أوالأنه تقرر الحفاظ عاى'اللعلومات المستقاة من هذه 
البيانات (مثل المقالات والكتب) التي كانت تعد «das. XS]‏ وتخزينها في المكتبات. وبشكل 
e Le‏ تم الإبقاء فقط على مجموعات البيانات الأكثر قيمة» مثل تلك ال مرتبطة بالمساعي 
العلمية والثقافية الأساسية والسجلات الحكومية: واممعاملات الاقتصادية: والعقود القانونة. 
وفي حالات eSI‏ الفنونء الكائنات ....إلخ والتي يمكن اعتبارها صورا معينة من البيانات 
فقد 63 تنسيقها وتخزينها بالأساس في المتاحف وصالات العرض جنبا إلى جنب مع البيانات 
الوصفية ال مرتبطة بها. وقد تم تخزين البيانات الخاصة معظم العلماء بشكل غير رسمي 
على ملفات وصناديق أو على مختلف محركات الأقراص الصلبة في مكاتبهم أو في منازلهم. 
وعندما يتقاعدون خارج الخدمة أو يتوفون يتم تدمير معظم آثارهم» ومعهم أي بيانات 
قاموا بإنتاجها. كما أن الغالبية العظمى من البيانات التي تم إنتاجها لأطروحات الدكتوراه 
تفقد بعد الانتهاء منهاء وغالباً لا يتم نشر حتى المعلومات المستقاة من البحوث. وعلاوة 
على ذلك فإن Sas‏ البحوث تاريخيا لم يطالبوا المشاريع التي قاموا بتمويلها بحفظ 
البيانات وتخزينهاء أو إن طلبوا ذلك فقد كان لفترة قصيرة من الزمن. وكما هو الحال في 
العديد من ا مشاريع التي Use‏ الاتحاد الأورويء biži‏ الاحتفاظ بجميع مواد المشروع 
ما في ذلك البيانات طمدة سبع سنوات» ولكن يمكن بعد ذلك التخلص منهاء وهو ما يتم في 
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كثير من الحالات» بسبب تكاليف التخزين والظن الغالب بأن المقالات الورقية الناتجة تمثّل 
قيمة أكير. 

ومع تطور حلول التخزين الرقمي» التي قللت التكلفة والمساحة التخزينية للاحتفاظ 
بالبيانات» فقد بدأ التخزين الطويل الأمد على نطاق واسع للبيانات الاعتيادية ا لمنخفضة 
التكلفة (انظر الفصل الخامس). فقد ظهرت أولى قواعد البيانات الرقمية التي ضمّت 
مجموعات البيانات في الخمسينيات والستينيات من القرن الماضي وكانت تنسق البيانات 
فى هياكل مسطحة أو هرمية منظمة )2012 (Driscoll‏ ومع ذلك. فقد كانت هذه 
الترتيبات غير فعالة للبحث والاستعلام عن البيانات» كما تم تطوير قواعد البيانات العلائقية 
(Relational databases)‏ ابتداء في عام ۱۹۷۰ من قبل إدغار كود (Edgar Codd)‏ وقد 
نظم خصائص البيانات المميزة (Attribute)‏ في مجموعة من الجداول المترابطة. حيث يتشارك كل 
جدول بحقل بيانات واحد على الأقل مع جدول آخرء فعلى سبيل ال «JUL‏ قد يكون رقم الضمان 
الاجتماعي هو الحقل ال مشترك بين جدولين (المفتاح التأشير $" (Indexical Key‏ أحدهما يحتوي 
على التفاصيل الشخصية (مثل العمرء الجنس: الحالة الاجتماعية» والعنوان) ويحتوي الجدول 
الاخر على ا متعلقات JUI‏ 4« ويسمح رقم الضمان الاجتماعي Jas p‏ البيانات للاستعلام à‏ 

كلا الجدولين boa‏ وإنتاج بيانات جديدة مشتقة منهما. وإذا كان ا مغتاح المشترك عنوانا 
heal‏ فيمكن عندها وضع البيانات XA) Lats sl bag‏ فكت فوا انات 
العلائقية تنظيما واس تعلاما A SÍ‏ فعالية وتعقيدا عن البيانات الهيكلية باستخدام لغات 
الاستعلام الهيكلية (SQL)‏ وجنا إلى جنب مع قواعد البيانات AAMI‏ سمح تطوير 
البيانات المجدولة (Spreadsheets)‏ بتنظيم وتخزين كميات كبيرة من البيانات الحسابية 
إضافة لتطبيق الصيغ وا معادلات عليها مما يؤدي إلى إنتاج بيانات مستقاة جديدة. وقد 
استكملت هذه الأشكال من قواعد البيانات» في السنوات الأخيرةء بقواعد البيانات غير 
الهيكلية W)‏ استعلام .2050[1-) التي مكنها التعامل مع كميات كبيرة من البيانات غير 
الهيكلية (انظر الفصل الخامس). 

Qaia‏ ات col aile aa TE‏ سيلا في الحالات التي تنتج فيها البيانات ابتداء 
بصورة رقمية (نشأت بالكود ilio], (binary code-,3L JI‏ بطرق تلقائه ومؤتمته» كما 


Vs‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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أنها عرضة للخسارة بشكل كبير بسبب التقادم في الرمجيات وال معدات. وقد بين O'Carroll‏ 
and Webb (2012)‏ أنه: «في حين بمكن لأي أحد التقاط كتاب كتب قبل مئة سنة: والنظر 
فيه» وقراءة صفحة منه» فإنه لن يكون ذلك بالمثل صحيحا لقرص مرن يحتوي على ملفات 
dca‏ لبرمجيات وورد بيرفكت أنشئت قبل ٠١‏ سنة فقط». وف المقابل» ينبغي أن تحوّل 
الأشكال التناظرية/ التماثلية للبيانات إلى الصورة الرقمية الثنائية على سبيل «JULI‏ مسحها 
ضوئيا أو إعادة تسجيلها وإدخالهاء والتي يمكن أن تكون مكلفة وتستغرق bög‏ طويلا 
على الرغم من إمكانية أتمتة هذه العملية Ui‏ الى حد ما. وقد حدت التكاليف والنفقات 

ا مربطة بالرقمنة (Digitisation)‏ من حيث التكلفة المادية:ء وقت ال موظفينء, وا معدات 
المتخصصة. من تطبيقها في العديد من المحفوظات الأرشيفية التناظرية التي تحتفظ بها 
العاف #885413 اللجموعات الشخصضة الخاصة. وتنا كا فحت basil Bia‏ لتمؤئل 
أنشطة JI‏ 43« فإن جهات خر ية غير ربحية مثل أرشيف الإنترنت (http://archive.org)‏ 
وتجارية مثل قوقل (Google)‏ تساعد على القيام Jis‏ هذه الأنشطة: وذلك باستخدام 
مواردهننا الذاتية أو تبزعات المحسنين من.عافة الأفراد مما يجعلهنا laus olo‏ للجميع 
(انظر الفصل الخامس). 

g‏ جميع الحالات» فإن البيانات ضمن حاويات البيانات الرقمية والمحفوظات الأرشيفية 
يمكن مشاركتها وإعادة استخدامها بسهولة وبتكلفة هامشية منخفضة: وذلك على الرغم 
من أنه من الممكن الحدّ فيما يتعلق بالوصول وإعادة الاستخدام بواسطة سياسات حقوق 
الملكية الفكرية. وعلاوة على ذلكء فإنه من ال ممكن معالجتها وتحليلها من خلال الأدوات 
الحسابية القويةء إذ أصبحت الإجراءات والحسابات التي كان من الصعب القيام بها يدويا 
أو باستخدام التقنيات التناظرية على سبيل JELI‏ المسطرة الحاسبة التناظرية Slide)‏ 
(rules‏ ممكنة في غضون بضعة أجزاء من AILI‏ وأكثر في بناء واختبار النماذج وأنظمة 
المحاكاة المعقدة. كا E FAEILA ERER PACM colsgle- a aue‏ 
بسهولة نسبيا ومدّها إلى أشكال أخرى من البنى التحتية للبيانات. 


فالىنىة التحتية للسانات هي الوسيلة المؤسسيمة واطادية والرقمية لتخزين وتبادل 
واستهلاك البيانات عبر التقنيات امرتبطه بعضها ببعضء وعلى مدى العقدين الماضيين على 


859 البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها V!‏ 
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وجه الخصوصء فقد تم بذل جهد كبير لتطوير وتعزيز هذه البنى التحتية» والتي تأخذ 
عدة أشكال: الكتالوجات» والأدلة: والبوابات» ومراكز Jols‏ المعلومات» والمستودعات: 
وا مستودعات الرقمية الموثوقة. والبنى التحتية السيرانية Cyber-Infrastructures)‏ 
Ulis .(Lauriault et al. 2007‏ ما تستخدم هذه ال مصطلحات بالتبادل ويجري الخلط 
بعضها ببعضء وذلك على الرغم من أنها تمثل أنواع مختلفة من الكيانات (انظر الجدول 
2 على سيل (JI‏ 

فالكتالوجات» والأدلة» والبوابات هي موارد مركزية تفصّل وتربط حاويات البيانات 
والمحفوظات الأرشيفية التي تحتفظ بها المؤسسات على المستوى الفردي. وقد توفر قوائم 
مفصلة إلى do‏ ما عن مجموعات البيانات التي تضمّهاء كما هكن أن تكون بمثابة مجاميع 
للبيانات الوصفيةء ولكن لا يستضيف اموقع نفسه البيانات )2013 (O'Carroll et al.‏ 
أما مستودع البيانات أو مركز تبادل المعلومات فهو مكان مشترك لتخزين حاويات البيانات 
وا محفوظات الأرشيفية والوضول إليها. وقد توفر هذه ال مستودعات وامراكز بعض خدمات 
البيانات من قبيل البحث والاسترجاع: وإدارة البيانات ومعالجتها. ولكن عملية إنتاج كل 
حاوية أو أرشيف تتم بشكل مستقلء ولذا فهي رها تفتقر إلى صيغ ومعايير وبيانات وصفية 
وسياسات مشتركة للبيانات. ومع «US‏ يسعى مستودع البيانات لضمان التزام كل أرشيف 
أو حاوية igang‏ من المؤاصفات المطلوبة ويقوم dino AU‏ والتدقيقء والتصديق على 
منح الشهادات لضمان سلامة البيانات وتعزيز الثقة بين المستخدمين )2012 (Dasish‏ 
وعرف )2013( O Carroll et al.‏ نوعين من ال مستوعات. مستودعات اموقع الواحد التي 
تستضيف كافة مجموعات البيانات في موقع واحد» ويمكن الوصول إليها من خلال واجهة 
على شبكة الإنترنت» على الرغم من إمكانية احتفاظها بنسخ احتياطية أو مواقع مثيلة في 
أماكن متعددة. والمستوعات ال متعددة المواقع التي تستضيف البيانات ضمن هيكل موحد 
يسمح بالوصول إلى مجموعات البيانات القائمة في عدد من المواقع المؤسسية. 

فالمستوع الرقمي الموتوق (TDR - Trusted Digital Repository)‏ هو مستودع 
مرخص موقع واحد أو متعدد المواقع تتمثل مهمته في توفير وصول آمن وموثوق به 
للبيانات التي يديرها على المدى البعيد )2002 .(RLG and OCLC‏ ومن اجل التاهل 
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كمستودع 39355( فصلت )5 :2002( RLG and OCLC‏ الخصائص ال مطلوب توفرها في 
البنية التحتية لهذه المستودعات وهي كالتالي: 
LE e‏ المسئولية عن الصيانة طويلة الأمد للموارد الرقمية بالنيابة عن المودعينء وما فيه 
مصلحة المستخدمين الحاليين والمستقبلين: وال مستهلكين أو ا مجتمعات ا معنية. 
البعيد. ولكن يحافظ أيضا على المعلومات الرقمية التي تقع ضمن نطاق مسؤوليته. 
o‏ توضيح المسؤولية 4JU.I‏ وضمان الاستدامة. 
o‏ تصميم أنظمتها وفقا للاتفاقيات والمعايير المقبولة والمعتمدة لضمان الإدارة المستمرة 
والوصولء وأمن المواد المودعة داخلها. 
٠‏ وضع منهجيات لتقييم المستودع. وذلك للتأكد من تلبيته للتوقعات المجتمع من حيث 
اموتوقيه. 
e‏ إمكانية الاعتماد على adl‏ التحتبة الخاصة بها وضمان تحمّل مسؤولياتها على المدى 
الطويل تجاه المودعين والمستخدمين بشكل علني وصريح. 
o‏ امتلاك السسراسات» والممارسات» والأداء الذي مكن تدقىقه وقباسه. 
ولي يمكن لمستودع ما الحصول على هذه المتطلبات؛ أكدت RLG and OCLC‏ 
)13 :2002( أنه ينبغي أن يكون متوافقا مع النموذج المرجعي لنظام المعلومات الأرشيفي 
امفتوح )2012 (OAIS Open Archival Information System-)(CCSDS‏ وآن متلك 
وأمن النظام: والمساءلة الإجرائيةء وتساعد كل هذه الخصائص معا على ضمان وبناء الثقة 
E‏ السانات ومستودعها. 
E E E EET ER ET‏ اک من محرة مجموعة من ايلحفوظآت RAED‏ 
الموثوقة فهي تمكن من تبادل البيانات والتشارك في موارد البنية التحتية باهظة الثمن. 
وتتألف البنية التحتية السيرانية من مجموعة متكاملة من المعدات المتخصصة والتقنيات 


ثورة السبانات السانات «a SJ!‏ والسانات c> gx AI‏ والبنى التحشة للسانات» والنتائج ا مترتة vv ue‏ 
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الشبكية (تشمل المراصد وال مرافق البحشة التجريسة: وشبكات الاستشعارء وما إلى (W5‏ 
والخدمات والأدوات لرمجيات التشغيل ال متبادل والبرمجيات الوسيطةء والخدمات ا مشتركة 
(المتعلقة بإدارة البيانات ومعالجتها)ء وأدوات التحليل مثل التمثيل البصري للبيانات 
(على سبيل «JUL‏ تطبيقات الرسوم البيانية ورسم الخرائط).: والسياسات المشتركة (فيما 
يتعلق بحق الوصول للبيانات واستخدامها وحقوق الملكية الفكريةء وغيرها) التي تمكن 
من نشر البيانات وتوزيعهاء وربطها بعضها مع بعض وتحليلها dia)‏ البنية التحتية 
السيبرانية 2007 .(Cyberinfrastructure Council‏ كما تسعى إلى تعزيز تنمية ال مجتمع 
الثقاف الذي يدعم التعاون المباشر بين الأفراد متجاوزا الحدود الجغرافية والمؤسسية 
.(Cyberinfrastructure Council 2007)‏ وبينما تستخدم اانا لوصف dadl‏ التحتية 
التى تمكن عمل مستودع بيانات موحد فإنها تستخدم هنا للدلالة على البنية التحتية 
للبيانات التي تتشارك في مواصفات تقنية مشتركة متعلقة بالنماذج. والمعايير: والبروتوكولات. 
وبعبارة 5,21« هناك قواعد صارمة متعلقة بتطبيق المعايير على البيانات والالتزام بها داخل 
البنية التحتية. وتشمل مثل هذه البنى التحتية السيبرانية تلك التي تنفذها الوكالات 
الإحصائية الوطنية والبنى التحتية المكانية الوطنية للبيانات» إضافة إلى البنى التحتية 
العلمية واسعة النطاق التي تتعلق بأبحاث الجينات» وعلم الفلكء والأرصاد الجوية وغيرهاء 
والتي تتطلب تخزين كافة البيانات ومشاركتها مع الامتثال لمعايير محددة من أجل تحقيق 
أقصى قدر من قابلية التشغيل البيني للبيانات وضمان جودة البيانات» والإخلاص والنزاهة 
التي تعزز الثقة. وهذه الأخيرة لها أهمية خاصة في مجال العلوم» والسياسات التي تقوم 
على أساسها مثل تتبّع تغيرات المناخ وتنبؤاته» حيث تعد سلامة البيانات أمرا بالغ الأهمية 
في المناقشات الجارية حاليا. 

وإضافة إلى بوابات البيانات» والملستودعات. والبنى التحتية. تم استحدات عدد من 
ا منظمات والهياكل المؤسسية التي تقدم المشورة بشأن أفضل الممارسات في مجال الحفظ 
الرقمي» وإتاحة ومشاركة البيانات» والتحقق من صحة العمل واطعايير المتعلقة بالأنواع 
امختلفة من بنوك البيانات» والدفع باتجاه تنميتها وتطويرهاء وتنسيق الجهود المختلفة 
بشأن ذلك (انظر الجدول 2-3). وتؤدي هذه المنظمات والهياكل المؤسسية عملها من خلال 
أنشطة عدة مثل تقديم البرامج التدريبية والتعليمية: واستضافة الندوات والمؤتمرات» وإنتاج 


vé‏ ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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الكتيبات والآدلة: وتوفير التمويل اللازم طبادرات محددة. وتكتسس هذه المنظمات أهمية 
نظرا لإسهاماتها à‏ خلق مجتمعات الممارسة بين مختصي السيانات» وتسهيل المطفاوضات بين 
الهيئات وتوسيع نطاق الجهود اممؤسسية» ووضع مبادئ توجيهية ومعايير مشتركة. ويركز 
بقية هذا القسم على مستودعات البيانات البحثية والبنى التحتية» ويفصل في الأسس 
امنطقية لها والتحديات التي تواحههاء كما A X SL Qe‏ البنى التحتدة الخاصة وامتعلقة 
بشركات البيانات التجارية في وقت لاحق ق هذا الفصل. 
جدول رقم (Y-Y)‏ 
أنواع وأمثلة البنى التحتية للبيانات 
النوع الأمثلة 


Data Holding حاوية الببانات‎ 


يُطلق على مجموعات غير رسمية من ملفات البيانات التي تكون على جهاز حاسب 


شخصي» ويسمى نظام النسخ الاحتياطي في بعض الأوقات. 












أرشيف لونی لبيانات الصور (LONI Image Data Archive-IDA)‏ هو أرشيف 
آمن لصور الجهاز العصبى والبيانات السريرية الطبية ذات الصلة بالمشاريع البحشة 
في جميع أنحاء القارة الأمريكية الشمالية والقارة الأوروبية. 


محفوظ السانات 


(أرشيف السانات) Data‏ 
Archive‏ 
أرشيف الموسيقى ALI‏ الموجوذ في مكتبة موسيقا لويب (Loeb)‏ في جامعة 
هارفارد الذي يقدّم تخزينا آمنا ووصولاً متاحا لمحتوى الأرشيف والتسجيلات 
التجارية الصوتية والمرئية للموسيقى من جميع أنحاء العام. 





الكتالوجات» DNI‏ البوابات» | تمكن خدمة البيانات الوطنية الأسترالية المستخدمين من تصفح أكثر من أربعمائة ألف 
البيانات diog‏ وا مجمّعون | من مجموعات البيانات وأكثر من ثلانمائة آلف مشروع تقوم بإنشاء مجموعات البيانات. 


Catalogues , Directories‏ | تتيح dS tI‏ الرقمية العامة الأمر يكية الوصول إلى مليونين وخمسمائة آلف سجل من 
Portals , Metadata ,‏ , سجلات السانات الوصفية من مكتبات» ومحفوظات» ومتاحف مقرها الولايات المتحدة. 


PPM. 22 d" à 2" : Aggregators 
وثلاثين من‎ dia من‎ ASY يوروبيانا هي بوابة إلكترونية ومجمّع للبيانات الوصفية‎ ndis 


المكتبات والمتاحف وال مكتبات الرقمية للوسائط المتعددة في جميع أنحاء أوروبا. 


محفوظات بيانات المجلس yaY‏ للعلوم الاجتماعية (CESSDA)‏ هى 
بوابة إلكترونية ومجمّع للبيانات الوصفية منذ ما يزيد عن ثلاث وعشرين سنة 
لمستودعات البيانات الأوروبية الإحصائية للعلوم الاجتماعية التي تضم أكثر من 
ثمانية وعشرين آلف من مجموعات البيانات. 





الفصل الثاني 


مستودعات بيانات الموقع 
الواحد 


Single-site Repositories 


مستودعات Dlo‏ متعددة 
المواقع 


Multi-site Repositories 


البنى التحتية السيبرانية 


Cyber- Infrasrtuctures 


AA 
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خدمات أرشفة وشبكات البيانات (DANS)‏ هو الأرشيف الوطني الهولندي 
لبيانات البحوث الرقمية. إضافة للأرشفة. وتقذه المبادئ التوجيهية للتدريب 
والاعتماد. 


أرشيف بيانات المملكة المتحدة (UKDA)‏ هو مستودع بيانات الموقع الواحد 
لبيانات بحوث العلوم الاجتماعية والإنسانيه الممولة من قبل مجلس Digal‏ 
الاقتصادية والاجتماعية (ESRC)‏ ولجنة نظم المعلومات المشتركة (JISC)‏ 
وجامعة إسيكس (Essex)‏ 


المستودع الرقمي الايرلندي (DRI)‏ هو مستودع رقمي موثوق للبيانات 
المعاصرة والتاريخية» الاجتماعية والثقافيةء وتقوم عليه المؤسسات الأيرلنديةء 
ويوفر إتاحة الوصول» والحفاظ ue‏ البيانات للجهات المعنية ذات المضلحة 
واكتشافها. 


أوبونير (Openaire)‏ هو مستودع رقمي متعدد ال مواقع للحصول على البيانات 
العلمية المفتوحة في منطقة البحث الأوروبية المكونة من واحد وأربعين منظمة 
وثلاثة Sg‏ بلدا WM‏ 

المكتبة الرقمية لتكساس (TDL)‏ هي مجموعة من مؤسسات التعليم العالي 
التي توفر منصة وخدمات مشتركة لتوفير الوصول المفتوح للبيانات والحفاظ 
عليها. 


توفر البنىة التحتبة للسانات الجغرافية المكاننة الكنذية (CGDI)‏ 
الوصول ال موحدء واطتسقء والدقيقء والقابل للتشغيل ا متادل للبيانات 
المكانية عير القطاعات والنطاقات الكندية. 





المصدر : مقس بتصرف من -O'Carroll et a!.(2013)‏ 
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جدول (Y-Y)‏ 
السانات واتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم الاجتماعية والإنسانية 


revues 


The Federation of All European www.allea.org اتحاد جميع الأكادميات‎ 
(Academies (ALLEA الأوروسة‎ 


المحفوظات الصوتية 
البريطانية والايرلندية 





British and Irish Sound Archives 
((BISA 


www.bisa-web.org 








الاتحاد الأوروبي لمحفوظات 
البيانات للعلوم الاجتماعية 


Consortium of European Social Science www.cessda.org 


Data Archives 





(Coalition for Networked Information (CNI www.cni.org التحالف من أجل معلومات‎ 


مارا( 


Common Language Resources and www.clarin.eu dolg موارد اللغة المشتركة‎ 
(Technology Infrastructure (CLARIN التحتية التقنية‎ 





Committee on Data for Science and www.codata.org لجنه البيانات للعلوم‎ 
للعلوع‎ 


Digital Services Infrastructure for Social www.dasish.eu الخدمات الرقمية للبنية التحتية‎ 
(Sciences and Humanities (DASISH للعلوم الاجتماعية والإنسانية‎ 


(Digital Curation Centre (DCC مرک كراشن الرقمئ‎ 
(Digital Library Federation (DLE www.diglib.org اتحاد المكتبة الرقمية‎ 
(Digital Preservation Coalition (DPC www.dpconline.org تحالف الحفظ الرقمى‎ 


(Digital Production Partnership (DPP للإنتاج الرقمي‎ 451 2JI 


Technology of the International 


Council for Science 








digitalproductionpartnership. 





co.uk 
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International Federation of Television www.fiatifta.org الاتحاد الدولي المحفوظات‎ 
(Archives (FIAT/IFTA Os» 5ALJI 


International Association for Social www.iassistdata.org الرابطة الدولية لخدمات‎ 
Science Information Services and الملعلومات والتكنولوجا‎ 
(Technology (IASSIST للعلوم الاجتماعيه‎ 


International Association of Sound and www.iasa-web.org الرابطة الدولية‎ 
والسمعية - البصرية‎ 





Audiovisual Archives 








اتحاد الجامعات للىحوث 
السياسية والاجتماعية 


Inter-university Consortium for www.icpsr.umich.eda/ 


(Political and Social Research (ICPSR icpsrweb/ICPSR 





Network of Expertise in Long-term 
(Storage of Digital Resources (NESTOR 


شبكة الخبرة www.langzeitarchivierung.de/ |  نيزختلا (à‏ 
على المدى الطويل للموارد | /Subsites/nestor/DE/Home‏ 


الرقمية 


مؤسسة الكواكب المفتوحة 


org 


المصدر : مقتىس بتصرف من 2013( .(O'Carroll et al.‏ 











Open Planets Foundation www.openplanetsfoundation. 


الأسس المنطقية OGLU daxil GU‏ البحشة: 
بالنظر إلى أن بناء البنى التحتية للبيانات هي ممارسة ليست باليسيرةء ومكلفة من حيث 
الموارد والوقت الذي يستلزمه إنشاؤها والمحافظة عليها بشكل مستمرء فينبغي أن تكون 
هناك أسباب معتبرة لإجراء مثل هذا المسعى والمضي فيه. ويستعرض الجدول (Y-€)‏ قائمة 
لأكثر من ثلاثين من هذه الأسباب مقسمة على ثلاثة أبعاد - مباشرة / وغير مباشرةء وفي ا لمدى 
القريب / وعلى المدى البعيدء والعامة / والخاصة بحسب تعريف )2010( .Beagrie et al.‏ 
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ويمكن أن تترجم هذه الأسباب تقريبيا إلى المكاسب العلمية واطالية» والتأثير التراكمي للفوائد. 
والمستفيدين من هذه الىنى التحتبة. 

وتتمحور المناقشات والحجج العلميه لتخزين» ومشاركة. وتوسيع البيانات داخل البنى 
التحتية للبيانات حول وعود من الاكتشافات والابتكارات الجديدة من خلال الجمع بين 
مجموعات البيانات والتوظيف الجماعي للعقول المشاركة. فمجموعات البيانات الفردية 
ذات قيمة في حد ذاتهاء ولكن عند ضمّها جنبا إلى جنب مع مجموعات بيانات أخرى 
أو تفحصّها بطرق وأساليب جديدة: فإن رؤى وأفكار جديدة من المحتمل أن تظهر 
وأسئلة جديدة من الممكن أن تتم الإجابة عليها )2007 (Borgman‏ فبسبب الطبيعة 
التراكمية» من خلال الجمع بين مجموعات البيانات» يمكن الزعم بتسارع وتيرة بناء المعرفة 
.(Lauriault et al. 2007)‏ وعلاوة على ذلك» يصبح من الممكن من خلال الحفاظ على 
البيانات تتبع الاتجاهات والأنماط مع مرور الوقتء وكلما ازدادت 833 التسجيل للبيانات» 
زادت معها القدرة على بناء النماذج وأنظمة المحاكاة ومن ثم زيادة الثقة في الاستنتاجات 
التئ يتم التوصل إليها )2007 JJ. .(Lauriault et al.‏ فإنه ومع مرور الوقت» تزداد 
القيمة التراكمية طمستودعات البيانات والبنى التحتية بحيث تصبح البيانات متاحة على 
نطاق واسع وبشكل أكثر يسراء وذلك من حيث النطاق والصلاحية الزمانية. 

ومن المرجح أن تعمل هذه المشاركة الاستراتيجية إلى بث روح التعاون بين الباحثين والفرق 
في التخصصات الجديدة: وتعزيز المهارات بصورة أكبر من خلال إمكانية الوصول إلى أنواع 
جديدة من السانات )2007 .(Borgman‏ وعلاوة على US‏ فإن Jols‏ المعلومات واعتماد 
معايير وبروتوكولات وسياسات البنية التحتية من شأنه أن يرفع من مستوى جودة البيانات 
وأن يفسح المجال لأطراف أخرى لإنتاج بيانات مشتقة والتحقق من البيانات المتاحة» ومن 
ثم 5 83b‏ سلامة البيانات )2007 .(Lauriault et al.‏ كما تعمل البنى التحتية e Là]‏ 
إتاحة بيانات عالية الجودة في التعليم وتحسين المصادر التربوية والتعليمية لتدريب الجيل 
القادم من الباحثين. كما أن البنى التحتية للبيانات هي الوسيلة الوحيدة لإدارة البيانات 
والمشاريع بكفاءة وفعالية في الحالات التى تعتمد فيها المشاريع العلمية بشكل كبير على 
أدوات تقنية المعلومات والاتصالات الباهظة الثمن» والتي ينتج عنها كميات هائلة من 
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البيانات» وكذلك في المشاريع التى تضم فرقا بأعداد كبيرة من الباحثين المنتشرين في جميع 
أنحاء العام لتحليل هذه البيانات» لذا فإن البنى التحتية للبيانات تمثل الوسيلة الوحيدة 
الفاعلة والفعالة لإدارة مثل هذه النوعية من البيانات والمشاريع )2007 (Borgman‏ 


وتتمحور الفوائد JUI‏ للبنى التحتية للبيانات حول الموازيين الاقتصادية التي تنشأ 
من خلال تقاسم ال موارد ومشاركتها وتجنب تكرارهاء والآثار المترتبة على إعادة الاستخدام 
للبيانات ال مكلفة. والثروة الناتجة من خلال الاكتشافات amsol‏ وإنتاج مجتمعات 
isi‏ كفاءة. فالبحث عملية مكلفة في العادة. حيث تنفق وكالات التمويل المختلفة 
بشكل جماعي مليارات الدولارات سنويا لتمويل النشاط البحثي» وينطوي جزء كبير من 
هذا النشاط على ازدواجية غير ضرورية في جهود إنتاج البيانات» ومعالجتهاء وإدارتهاء 
وتحليلها. وبدلا من إنشاء عدد كبير من المحفوظات الأرشيفية الخاصة؛ فإنه من المنطقي 
إنشاء عدد أقل من البنى التحتية المخصصة التي تقوم بتقديم وتحضير البيانات الأساسية 
على صورة موحّدة: وتنتج فعالية كبيرة في الجهد. وتمكن كذلك وصولا أوسع للبيانات 
للأفراد الباحثين والمؤسسات كون تكاليف الدخول إلى حقل أو مجال بحثي في العادة 
.(Fry et al. 2008) dhal‏ وإضافة إلى ذلك. ستصبح عمليات ونتائج المشاريع البحثية 
أكثر شفافية ويمكن الحكم على مدى تمثيلها القيمة مقابل المال. وفضلا عن Jodl‏ من 
الهدر والحفاظ على الثمار الناتجة من هذه الجهود وتقاسمهاء فإنها ستعمل على تعظيم 
العائد من الاستثمار من خلال تمكين أكبر قدر من المكاسب التي يمكن الحصول عليها من 
البيانات )2007 .(Lauriault et al.‏ فعلى سبيل JELI‏ قد ينتج عن إتاحة البيانات على 
نطاق واسع صناعات جديدة قائمة على ا معرفة وتكون شركات منبثقة ومنفصلة من خلال 
تسويق البحوث ال ممولة من القطاع العام (انتلاف العلوم 2013 (Science Coalition‏ 
كما يمكن للبيانات ضمن البنى التحتية للبيانات أن تؤدي إلى طرق أكثر فعالية في الحوكمة 
والإدارة ا مجتمعية. على سسيل «JUL‏ توفر العديد من البنى التحتية للبيانات ال مكانية 
الوطنية. إضافة إلى دعمها AAAI Sgal‏ آدوات فعالة للإدارة والحكومة الإقليمية: 
وتمكن من الاستعداد للطوارئ والاستجابة للكوارث بصورة أكثر فعاليةء وتسهيل التخطيط 
بين الدول. 
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وبحسب ما تم إيضاحه من خلال النقاش حتى الآن» فإن الفوائد المحتملة ال مكتسبة 
من البنى التحتية للبيانات هى فوائد ممتدة وغير محصورة بالقطاع العام أو الخاص 
.(Beagrie et al. 2010)‏ وقد ظهر جليا ف الواقع ان استراتيجية مشاركة البيانات 
وتقاسمها تعود بالفائدة على جميع الأطراف - الباحثينء ا مؤسسات» ا ممولين» والمؤسسات 
العامة والخاصة. فعلى مدى العقدين «yell‏ وبالنظر إلى المكاسب امتوقعة من مشاركة 
السيانات وتبادلهاء عملت الوكالات البحشية للحكومات الوطنية والهيئات الإقليمىة مثل 
الاتحاد الأوروبي. T‏ إلى جنب مع ال منظمات الخيرية» على الاستثمار بنطاق واسع في تمويل 
مجموعة كبيرة من المبادرات ا مختلفة. ومع eUS‏ وكما هو مبين olol‏ فهناك مقاومة Jh‏ 
هده المشاريع» وعلى الأخص من قبل الباحثين أنفسهم» ومن الواضح أنه على الرغم من 
ان هناك فوائد لا شك فيهاء فهناك ايضا تكاليف مرتبطة بإنشاء البنى OLLU daxil‏ 


تحديات elu‏ البنى التحتية للسانات: 

على الرغم من الفوائد المتوقعة والمُدركة من البنى التحتية للبيانات» إلا أنها لم تلق 
ترحيباً S alle‏ كما ul‏ أثبتت idis Lili Wao‏ ها: فهناك مجموعتين رئيسيتين من 
القضايا الفاعلة - التقنية والاجتماعية/ السياسية - التى تعوق تطوير البنى التحتية للبيانات 
وتنميتهاء وستواصل القيام بذلك لبعض الوقت. 


جدول رقم (5-؟) 
فوائد مستودعات البيانات والبنى التحتية OLLU‏ 
aT E‏ 
0 


إعادة تحديد الأهداف وإعادة استخدام البيانات. | انخفاض تكاليف المحافظة على البيانات في المستقبل. 





زيادة الإنتاجية البحثية إعادة توظيف البيانات للمهتمين الجدد. 





تحفيز أنواع جديدة من التواصل / التعاون. إغادة توظيف المنهجيات ابلستخدمة. 
(eee‏ 
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حي امان عل الما ليك 


DO 2‏ قاعدة امهارات. 


الأدوات وال معايير يحتمل أن تزيد من مستوى جودة 
الببانات. 






زيادة الإنتاجية / النمو الاقتصادى. 





تقليل الاستفسارات العشوائية المتعلقة cb Jb‏ 


التشت من البحث / سلامة Casu!‏ 


فوائد على المدى القريب الفوائد على المدى الطويل 
قيمة للباحث والطلاب الحاليين. تأمين القيمة للباحثين والطلاب ا مستقبليين. 


عدم فقدان البيانات بتغير الباحثين. إضافهة القيمة مع مرور الوقت ونمو المجموعة 
وتطورها للحد الأقصدى. 








توسيع إتاحة الوصول حيث التكاليف الباهظة | زيادة سرعة البحث والوقت اللازم لإدراك آثاره. 
yi LU‏ / المؤسسات. 





إعادة الاستخدام على المدى القصير للبيانات المنسقة | يحفز الأسئلة البحثية الجديدة: وبخاصة المتعلقة 
| بالسسانات المرتبطة والمشتقة. 


کک — 


.Beagrie et al. 2010; Fry et al 2008 امصدر:‎ 











AY‏ 859 البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 





AVA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


البيانات الصغيرة» والبنى التحتية للبيانات» ووسطاء البيانات 

إن إنشاء بنية تحتبة عاملة وقابلة للتشغيل المتبادل OLLU‏ ليس im bios‏ خاصة 
إذا كان النظام موثوقا ويقدّم مستويات مختلفة من إتاحة الوصول اعتمادا على تعريف 
المستخدم وضمانات فيما يتعلق بمصدر البيانات وسلامتهاء ونزاهتهاء وصلاحيتهاء فذلك 
يتطلب تعاونا مكثفا وواسع النطاق وال موائمة بين منتجي البيانات ومالك المحفوظات 
الأرشيفية فيما يتعلق بالتالي: 

٠‏ إجراءات إنتاج البيانات. 

« تماذج البيانات ومعايير البيانات. 

o‏ البيانات الوصفية والتوثيق. 

o‏ إجراءات تحضر وتنقية وإدخال البيانات. 

o‏ جودة CUI‏ وضمانها. 

e‏ سياسيات الحفاظ على البيانات» والنسخ الاحتياطيء والتدقيق عليها: 

o‏ البرمجيات واممعدات. 

o‏ أمن وحماية المعلومات. 


o‏ سياسات الوصولء ومنح التراخيص» والاستخداع» وإعادة الاستخدام. والخصوصية. 
والجوانب الأخلاقية. 

o‏ سياسة الملكية. وحقوق الطبع والنشرء وحقوق المملكية الفكرية. 

o‏ الترتيبات الإدارية واليات تنظيم الإدارة والحوكمة. 

boë o‏ البنية التحتية وخدماتها وإدارتها. 

(Borgmann 2007; Data Seal of Approval 2010; O Carroll and Webb 2012) 

فالبنية التحتية للبيانات لن تنجح إلا إذا كان لديها 555 طويلة «Ja I‏ وهناك التزام 
لإدارة المحتوى نيابة عن المودعين والمستخدمين وتحمل مسؤوليتها. مع التطبيق التام 
لجميع العوامل المذكورة أعلاه بشكل فعال )2012 (O'Carroll and Webb‏ 
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فالقضايا التي تمت الإشارة إليها ليست مجرد قضايا تقنيةء ولكنها أيضا اجتماعية وسياسية 
ذلك لأنها تتطلب التفاوض والاتفاق على طريقة تصميمها واختيارها ومتطلبات إدارتها 
القائمة بين العديد من الأطراف - «x Sall‏ والمصممين:ء «xe lo‏ والمديرين والمودعنء 
ومجموعات الضغط والتوجيه: والمساهمين وأصحاب المصالح الخاصة الأخرى - في سياق 
مختلف التعليمات» واللوائح» والقوانين المتعلقة «e Lob‏ وتخزين» ومشاركة البيانات. ومن 
«ed‏ فهي تتشكل بواسطة الأجندات الشخصية والشخصيات. والقيم ال مؤسسية» والالتزامات 
والوصايات» والثقافات» والهياكلء والعمليات» والتمويل» والقضايا الحكومية. والتبعيات 
الإجرائية حيث أنه مجرد أن يبدأ المشروع في مسار معينء فسيكون من الصعب غالبا توجيهه 
في مسار مختلف كليا عنه )2007 (Feenberg in Lauriault 2012: Lauriault et al.‏ 
كما يمكن أن يكون تجميع ومواءمة المحفوظات الأرشيفية المعتمدة على مسارات تقنية 
مختلفة عملية في غاية الصعوبة: وطويلة الأمد ومكلفة lg‏ تتطلب من تلك المشاريع 
إجراء تغييرات لتحديث بياناتها المتقادمة لتتوافق مع المواصفات المتفق عليها في الموائمة 
.(Lauriault 2012)‏ وهذا هو السبب ف اعتماد العديد من ال مشاريع الأرشيفية على بنية 
مستودع البيانات بدلا من السعي لتصبح بنية تحتية إلكترونية/ سيبرانية. 

Los‏ بعد الصعوبات المتعلقة بإنشاء هياكل Jols‏ البيانات» إقناع أصحاب البيانات 
أنفسهم بتبادل سلعتهم الثمينة (بياناتهم)ء فهناك lua‏ أساسي في البحوث الأكادهية وهو 
إتاحة الوصول المفتوح؛ معنى» أن جميع جوانب إنتاج المعرفة ينبغي أن تكون متاحة بحرية 
للآخرين لتفحصها ونقدها. وهذا المبدأ لم ass‏ به على النحو الأمثل أبداء إذ تختفى الأبحاث 
الآكادمية في الغالب خلف حواجز الأجور ويتردد الباحثون في مشاركة بياناتهم وتبدلها مع 
الآخرين. وكما أشار )2007( Borgman‏ فإن مشاركة البيانات وتبادلها شائع في عدد قليل 
من التخصصات مثل ele‏ الفلك ele (Astronomy)‏ الجينات (Genomics)‏ وعلم البيانات 
العمرانية بهيتتها الرقميه (Geomatics)‏ والتى تعتمد على فرق duale‏ كبيرة وموزعة جغرافيا؛ 
Ul‏ في التخصصات الأخرى فيجري ف أحيان نادرة مشاركة البيانات وقد لا تجري على الإطلاق. 
وقد خلصت Borgman‏ إلى أن «السر الصغير القذر» وراء تشجيع مشاركة البيانات» وتبادلها 
هو عدم التبادل لكثير من البيانات ف الواقع )1059 :2012 .(Borgman‏ وذلك HY‏ هناك 
عددا من المثبطات التي تحول دون تبادل البيانات ومنها: 


^t‏ ثورة السانات السانات الكىرةء والسانات cá 9x45!‏ والىنى التحتىة للسانات» والنتائج daah‏ عنها 
ca ihn B M Bi M‏ 
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ه عدم وجود مكافات للقيام رذلك. 
o‏ الجهد اللازم لإعداد وأرشفة البيانات. 
o‏ نقص الخرة واموارد والأدوات اللازمة لأرشفة السبانات. 
٠‏ مخاوف من القدرة على استخراج قيمة من البيانات قبل الغيرء وذلك من حيث الأوراق 
العلميه وبراءات الاختراع: ونظرا للجهد امستثمر à‏ إنتاج AL!‏ 
o‏ المخاوف بشأن الكيفية التي سيتم بها استخدام البيانات» خاصة إذا كانت تتعلق 
بأشخاصء أو كيف ممكن أن يساء التعامل معها أو يساء تفسيرها. 
٠‏ المخاوف بشأن الاستفسارات بخصوص إنتاج البيانات والطلبات التي من شأنها أن 
o‏ مخاوف من القضايا المتعلقة بالكشف عن البيانات ونتائج البحوث التي ممكن تقويضها 
من خلال تفسيرات بديلة لنفس البيانات. 
ASLI LLAS o‏ الفكرية. 
٠‏ الخوف أنه لن يتم استخدام البيانات» وبالتاليتشكل الأرشفة جهداضائعا. 
Borgman 2007, 2012; Strasser 2013)‏ (. 
فمن الواضح أن ضمان البيانات من خلال أرشفتها لإعادة استخدامها مستقبلا سوف 
يتطلب dh‏ من محرد انشاء AM‏ السانات "d w daoil dios‏ ذلك يتطلب 
Ga‏ والجزرة, فمن gr ls dol‏ الحوافز "T Fert‏ ق أيداء da‏ 
البيانات. مثل تشجيع الاقتباس والإسناد عند إعادة استخدام البيانات )2012 (Borgman‏ 
وتوفير الأموال الكافية لأرشفة البيانات ضمن جوائز المنح. ومن ناحية أخرىء بدأت وكالات 
الأبحاث في إجبار الباحثين على إيداع وتبادل البيانات» مع مراعاة الجوانب الأخلاقية وحقوق 
ا ملكية SJ]‏ كشرط لتمويل البحوث. 
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وسطاء السانات والأسواق :(Data Brokers and Markets)‏ 
متلك القطاع الخاص دافعا مختلفا lao‏ لإنتاج وإعادة استخدام البيانات عن ذلك الذى 
عند الأكاديمميين: فالبنى التحتية للبيانات البحثية تسعى لتحقيق الصالح العام من خلال 
انشاء مشاعات للبيانات لتسهيل وتشجيع تبادل البيانات وإعادة استخدامها. às‏ المقابلء 
sa hil‏ البيانات (يسفون blof‏ مجمعي أو مختزلي أو بائعي البيانات) البيانات 
ويجمعونها معا ويعيدون تعبئتها (تحزمها) في البنى التحتية للبيانات التي يملكها القطاع 
الخاص لعرضها للإيجار (للاستخدام طمرة واحدة أو لاستخدامها تحت شروط الترخيص) 
أو إعادة البيع على أسس ربحية. وتشمل اللمنتجات قوائم العملاء/الزبائن ا محتملين 
الذين يستوفون معايير معينة (بما في ذلك تفاصيل مثل الأسماءء العناوين: أرقام الهاتف. 
وعناوين البريد الإلكتروني. وكذلك معلومات Jio‏ «الجنس» العمرء العرق» وجود الأطفالء 
الدخلء قيمة المنزلء ملكية بطاقة الائتمان» الوضع الائتمانى» أنماط الشراء. والهوايات»؛ 
(CIPPIC 2006: ii)‏ والتدقيق على الخلفية الأمنية»ء ومجموعة من منتجات البيانات 
المشتقة التي أضاف لها الوسطاء قيمة من خلال التكامل» ومنتجات تحليل البيانات 
التي تستخدم في معظم الأحوال لحملات الدعاية والتسويق ال مصغرة: وتقييم الجدارة 
الائتمانية والتصنيف الاجتماعي للأفرادء وتوفير خدمات البحث عن المفقودينء وتقديم 
تحليلات الأعمال ال ممفصّلة )2006 .(CIPPIC‏ وفي حالة القوائم» فهي في معظمها مستأجرة 
وف كثير من الحالات لا يستلم المستأجر AEI‏ حيث يعمل مكتب خدمة كطرف ثالث 
على إعداد وإرسال البريد بالنيابة عنهم )2006 .(CIPPIC‏ وبالمثلء مع تحليلات البيانات. 

حيث يتلقى العملاء نتائج تحليل البيانات» وليس ذات البيانات الأساسية. 
إن coL se‏ اختزال السانات وإعادة سعهاء وما برتبط بها من تحليل للسانات وخدمات 
ذات قمة A‏ هي صناعة ارات الدولارات» مع كميات هائلة من البيانات وال معلومات 


امستمدة التي : els «x99‏ وتشترى A‏ يومى عبر ais‏ ونا من الأسواق —-— 


والأمن الخاص» والاقتراع السياسيء وإلى آخره. وتتعلق هذه البيانات بجميع جوانب الحياة 


1^ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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والترفيه» والجرهة» وتفاعلات وسائل التواصل الاجتماعية» وإلى اخره» فوسطاء البيانات 
المتخصصين هم متواجدون منذ فترة «4b slo‏ يجمعون البيانات من اشتراكات وسال الإعلام 
(على سبيل «JULI‏ الصحف. واطمجلات)ء وتجار التجزئة عبر طلبات البريدء واستطلاعات «JI‏ 
والدراسات الاستقصائيةء ووكالات السفرء والمؤتمرات: والمسابقات» وتسجيلات وضمانات 
ا منتجات» وشركات معالجة الدفع والسداد. والسجلات الحكومية. وإلى آخره CIPPIC)‏ 
2006(. وف السنوات الأخيرة. وخاصة منذ ظهور الإنترنت. توسعت هذه الصناعة بشكل 
سريع» مع التنوع في البيانات التي تم التقاطها واختزالهاء واممنتجات والخدمات التي تقدمهاء 
وغالبا ما تجمع معا على j>‏ سواء البيانات الصغيرة والكبيرة. 

فبيع البيانات للوسطاء أضبح Jig‏ تدفقا مهما للدخل للعديد من الشركات: فعلى سبيل 
المثالء يبيع تجار التجزثئة؛ في كثير من الأحيان» البيانات المتعلقة بالعمليات Jis‏ تفاصيل 
بطاقة الائتمان» ومشتريات العملاء وبرامج الولاء الخاصة بالمتجرء وإذارة علاقات العملاء 
ومعلومات الاشتراك. كما تبيع المواقع الإلكترونية بيانات النقر (الاختيارات) المتعلقة 
بكيفية تصفح شخص ما بلوقع على شبكة الإنترنت والوقت الذي يقضيه على مختلف 
الصفحات. وبالمثل تستخلص شركات وسائط الإعلام» مثل محطات الصحف والإذاعة 
والتلفزيون» البيانات الواردة في محتواها (على سبيل JELI‏ الأخبارء والإعلانات). وتستخلص 
شركات وسائط التواصل الاجتماعي البيانات الوصفية وبيانات المحتوى طمستخدميها 
وتستخدم هذه البيانات لتحديد المواصفات الأساسية للمستخدمين ومنتجات البيانات 
الخاصة بهم» أو بيع البيانات لوسطاء البيانات. على سبيل «JUL‏ تستخدم شركة فيسبوك 
املفات التعريفية للمليارات من مستخدميهاء وشبكاتهم الاجتماعية. والمحتوى الذي 
يقومون daxi‏ (المفضلاتء والتعليقات. والصورء والفيديوهات» وما إلى ذلك) لتمكين 
مجموعة من المنتجات الإعلانية مثل الإعلانات الموجهة للجماهر المتمائلة Lookalike)‏ 
(Audiences‏ والجماهير ا مخصصه المدارة (Managed Custom Audiences)‏ وفتات 
الشريك (Partner Categories)‏ وذلك بالشراكه مع وسطاء البيانات الكبيرة والملسوقين 
مثل bl‏ لوجيكس «(Datalogix)‏ وأبسسلون (Epsilon)‏ وأكسيوم (Acxiom)‏ وبلو كاي 
(BlueKai)‏ من أجل دمج بيانات الشراء الخاصة بهم التى لا تخص فيسبوك مع البيانات 
السلوكية التى يوفرها الفيسبوك )2013 (Edwards‏ 


ثورة السبانات السانات OSI‏ والسانات cá gx AI‏ والبنى التحشة للسانات» والنتائج ÀS jbl‏ عنها AV‏ 
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فبطرق مختلفة: يتخلى الأفراد عن البيانات الشخصية الخاصة بهم» عن قصد أوعن غير 
قصدء وبدرجات متفاوتة: بصفة مشترينء أو مشترکین» أو مسجلينء أو «Lael‏ أو dolo‏ 
بطاقات» أو مانحین» أو متسابقین» أو مشاركين ف الاستطلاعات» أو حتى مجرد مستفسرين 
.(CIPPIC 2006: ii)‏ وعلاوة على US‏ وحيث إن إنشاء. وإدارةء وتحليل البيانات هي 
مهمه متخصصة. تستعين العديد من الشركات بجهات خارجية من شركات معالجة البيانات 
وتحليلاتها للوفاء بمتطلبات البيانات الخاصة بها. وتستطيع هذه الشركات» من خلال 
تقديم هذا النوع من خدمات البيانات مختلف العملاءء بناء مجموعات بيانات واسعة 
النطاق» والتي يمكن الجمع بينها وحزمها لاستخدامها في إنتاج بيانات مشتقة جديدة» والتي 
بدورها توفر المزيد من الأفكار والرؤى مقارنة بتلك التي مكن تحصيلها من مصدر واحد 
فقط SLL‏ وإضافة إلى هذه البيانات التى يحصل عليها وسطاء البيانات من القطاع 
الخاص» يعمل هؤلاء الوسطاء كذلك على الحصول على مجاميع بيانات القطاع العام سواء 
التي تتعلق بالأفراد أو تلك التي تخض مجموعة منهم كفئة معينة وأماكنهم مثل بيانات 
سجلات اطلكية والتعداد السكاني» كما يقومون باستئجار/ أو شراء القوائم المتعلقة بالأفراد 
من الجمعيات الخيرية والمنظمات غير الحكومية. 

ومن خلال تجميع البيانات من مصادر متنوعةء ينشئ وسطء البيانات بنية تحتية من 
السسانات الضخمة dbol xls‏ فعلى سبل «JU‏ تشتهر شركة إيسيلون (Epsilon)‏ بامتلاك 
بيانات عن SL‏ مليون بطاقة Yg‏ من أعضائها في جميع أنحاء العام إضافة إلى بنك 
معلومات يضم بيانات ذات صلة بمئتين وخمسين مليون مستهلك ف الولايات المتحدة 
وحدها )2013 (Edwards‏ كما تشتهر شركة أكسيوم (Acxiom)‏ بإنشائها Ko‏ للمعلومات 
يتعلق بخمسمائة مليون مستهلك فعّال في جميع أنحاء العام (تقريبا dta‏ وتسعون مليون 
«ac‏ ومئة وستة وعشرون مليون أسرة في الولايات اممتحدة)ء مع نحو ألف وخمسمائة 
معلومة عن كل شخص,» وتنفذ خوادمها أكثر من خمسين تريليون عملية في السنة. وتجاوز 
إجمالي تدوير رأس المال للشركة المليار دولار )20122 (Singer‏ كما تدير أيضا قواعد 
بيانات منفصلة؛ أو تعمل مع سبعة وأربعين شركة من كبرى الشركات الطمئة الأكبر في العام 
.(Singer 2012a)‏ وتزعم شركة داتا لوجيكس (Datalogix)‏ بتخزينها Ollo‏ متعلقة 
مشتريات ل تتم عن طريق الإنترنت تبلغ قيمتها أكثر من تريليون دولار )2013 (Edwards‏ 


A^‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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وتشمل شركات الوساطة والتحليل للبيانات شركات أخرى مثل شركة ألايانس داتا سيستمز 
(Alliance Data Systems)‏ وإى بيرو (eBureau)‏ وتشويس بوينت (ChoicePoint)‏ 
وكورلوجيك (Corelogic)‏ وإيكيوفاكس (Equifax)‏ وإكسبيريان (Experian)‏ اي دی 
آنالاتکس (ID Analytics)‏ وإنفوجروب (Infogroup)‏ واننوفيس (Innovis)‏ وانتلیوس 
(Intelius)‏ وريكورديد فوتشر (Recorded Future)‏ وسيسنت (Seisint)‏ وترانز يونيون 
.(TransUnion)‏ وتتجه كل شركة من هذه الشركات إلى التخصص فى أنواع مختلفة من 
البيانات ومنتجات البيانات والخدمات» فعلى سبيل JULI‏ تقيّم شركة إي بيرو العملاء 
المحتملين بالنيابة عن شركات بطاقات الائتمان» وا مقرضين» وشركات التأمين» والمؤسسات 
التعليميةء كما تقدّم شركة إنتليوس خدمات البحث عن الأشخاص والتحري عن خلفياتهم 
(Singer 2012a)‏ 


cele JS os‏ فإن مبتغى وسطاء البيانات وشركات التحليل هو مجموعة واسعة من 
البيانات (الصغيرة والكبيرة): والمتعلقة بأكر شريحة ممكنة من olg GLI‏ تكون هذه 
البيانات مترابطة بشكل كبير ويمكن تمييزها (تحوي تغريف فريد) بحسب طبيعتهاء وكلما 
استطاع وسيط البيانات تصدير ودمج لزيد من البيانات» كان عمل منتجاته أكثر نجاحا 
وعلى النحو الأمثلء واكتسب ميزة تنافسية عن منافسيه الآخرين. ويمكن من خلال جمع 
السيانات معا وهيكلتها بشكل مناسب لوسطاء اسانات اشتقاق Ollo‏ حديدة: وملفات 
تعريفية عن الأفراد والمناطق: والقيام بإجراء النمذجة التنبؤية لتوقع ما قد يفعله الأفراد 
في JB‏ ظروف مختلفة وق أماكن مختلفة. وهذا من شأنه آن مکن من تحديد ا مستهد فين 
وا مخاطر بشكل أكثر فاعلية بين مختلف المستهلكين وأن يُعطي مؤشرا على مدى التصرف 
المحتمل لهؤلاء المستهدفين والدفع بهم لاختيار استجابة معينة (على سبيل «JEU‏ اختيار 
وشراء paie‏ معين)» فشركة أكسيوم تسعىء» على سبيل JULI‏ لربط البيانات غير المتوافرة 
على الإنترنت (Offline Data)‏ والسانات المتوافرة على الإنترنت «(Online Data)‏ وحتى 
السانات المتنقلة (Mobile Data)‏ من أجل تكوين نظرة شاملة متعددة الزوايا عن 
المستهلكين. حيث تستخدم هذه البيانات لإنشاء ملفات تعريفية مفصلة ونماذج تنبؤية 
متماسكة (Singer 2012a)‏ فهذه المعلومات والنماذج مفيدة T‏ لشركات الشراء لأنها 
تمكنهم من تركيز جهودهم امتعلقة بالتسويق واطبيعات. وتزيد من فرص نجاح عملياتهم» 
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في ذات الوقت الذي تمكنهم من الحد من النفقات من حيث الهدر والخسارة التي قد تنتج 
عن استثمارات محفوفة بالمخاطر. ومن ثم تسعى هذه الشركات لتصبح أكثر فعالية وكفاءة 
في عملياتها باستخدامها لمثل هذه المنتجات. 

ومن امثير للاهتمام» أنه بالرغم من امتلاك وسطاء البيانات وشركات التحليل لكميات 
كبيرة ومتنوعة من البيانات الشخصية التي تستخدم منتجاتها لتصنيف واستهداف الأفراد 
والأسر اجتماعياء فقد كان هناك نقص ملحوظ ف الدفع بالاهتمام النقدي لعمليات هذه 
الشركات. ففي الواقع» هنالك ندرة في التحليل الأكاديممي والإعلامي عن هذه الشركات 
والآثار المترتبة على عملها ومنتجاتهاء ويعود السبب في ذلك جزئيا إلى أن هذه الصناعة 
بعيدة عن الأضواء وسرية نسبياء ولا ترغب في توجيه انتباه الجمهور إليهاء وزعزعة 435 
الجمهور في أصولها وأنشطتهاء والتي قد تؤدي إلى حملات عامة للشفافيةء «Je ls‏ 
والتنظيم. فوسطاء البيانات بشكل عام غير منظمين إلى حد كبير في الوقت الحاضرء كما 
أنهم غير ملزمين قانونيا بتزويد الأفراد بإمكانية الوصول إلى البيانات المحفوظة عنهم ولا 
هم ملزمون بتصحيح الأخطاء المتعلقة بهؤلاء الأفراد (Singer 2012b)‏ وإضافة إلى أن 
بيانات ومنتجات هذه الشركات يمكن أن يكون لها تأثير عميق في الخدمات والفرص المقدمة 
col, 330‏ مثل ما إذا كان سيتم تقديم عرض لفرصة عملء أو قبول تقديم طلب قرضء أو 
إصدار بوليصة تأمينء أو الموافقة على الاستئجار. وتكلفة السلع والخدمات المقدّرة على 
أساس ال مخاطر المتوقعة والقيمة بالنسبة لشركة ما )2002 (Lyon‏ 

إن قلق البعض» من فيهم 2013( (Edith Ramirez‏ رئيسة لجنة التجارة الاتحادية 
(Federal Trade Commission)‏ ق الولايات الممتحدةء يتمثل ق ممارسة هذه الشركات 
شکلا من أشكال حتمية البيانات (Data Determinism)‏ التي لا يجري فيها فقط تصنيف 
الأفراد والحكم عليهم على أساس ما ogled‏ ولكن على التنبؤ ها قد يفعلونه في المستقبل 
باستخدام خوارزميات هي أبعد ما تكون عن الصحة والكمال» بحيث قد تحمل في ثناياها 
تحيزات تتعلق بالعرقء والإثنيةء والجنسء والحياة الجنسية. وحتى «OI‏ فهم صناديق 
سوذاء تفتفر إل الرفانة المجدية والإجرادات المعالجة: وتستخدع ييانات متففصة الجودة 
على الأغلب» ومن ثم تكون عرضة للخطأ (انظر أيضا للفصل العاشر). وعلاوة على ذلك 
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فإن هذه الشركات تستخدم البيانات لغير الأغراض التي تم إنشاؤها لأجلهاء وبالتأكيد 
ليست لأغراض أولئك الذين تشير البيانات إليهم وتمثل ما قد يرغبون 4,3« فالذين يتقدمون 
ببياناتهم للحصول على بطاقة ولاء ا متجر لا يتوقعون بالضرورة أن يتم بيع بياناتهم 
واستخدامها لأغراض تتجاوز علاقتهم مع المتجرء ولا يتوقعون استخدامها بطرق قد تعرضهم 
للعقاب وامحاسبة بعد ذلك )2013 (Ramirez‏ وبينما يرحب بعض المستهلكين بالعروض 
الشخصية من المتاجر sl‏ الإعلانات المموجّهة على المواقع الإلكترونيةء يعدها البعض الآخر 
تطفلا واستغلالية .(Singer 2012a)‏ وعلاوة على ذلك» فإن كنز البيانات التي قد يكون 
لها قيمة في المستقبل كإجراء للمضاربة السوقيةء هو انتهاك لقوانين الحدّ من البيانات التي 
تنص على وجوب الإبقاء على السانات محددة القيمة فقط )2013 awg .(Raley‏ وسطاء 
البيانات هدفا رئيسيا للمجرمين العازمين على الاحتيال وسرقة الهويات» وذلك بالنظر إلى 
حجم السجلات الشخصية الحساسة مثل الأسماءء والعناوين: وأرقام الهوية (مثل الضمان 
الاجتماعي» وجواز السفرء ورخصة (SLI‏ وأرقام بطاقات الائتمان المتوافرة لديهم. وفي 
الواقع» فقد تابعت لجنة التجارة الاتحادية (Federal Trade Commission- FTC)‏ أكثر 
من أربعين قضية لخروقات أمنية خطيرة للبيانات» أغلبها ضد Ua us‏ البيانات» لفشلهم في 
توفر ضمانات أمنية كافية على البيانات )2013 (Ramirez‏ 

وف الآونة الأخيرة» وف أعقاب الخروقات الأمنية والكشف عن صفقات بيع مشبوهة 
واستخدام لبيانات حساسة )2013 (Dwoskin‏ جنبا إلى جنب مع الكشف عن برنامج 
بريزم التجسسي لوكالة الأمن القومي (NSA PRISM)‏ ووصول الحكومة إلى سجلات تجارية 
(Greenwald and MacAskill 2013)‏ إضافة للأخبار عن فضيحة قرصنة الهاتف العامي 
واستجواب ليفينسون (Leveson)‏ في المملكة المتحدة http://www.levesoninquiry.)‏ 
(org.uk‏ فقد انصب امزيد من الاهتمام على وسطاء البيانات وممارساتهم التجارية. ففي 
أواخر عام 2012 استدعت لجنة التجارة الاتحادية تسعة من وسطاء البيانات لاكتشاف 
امزيد حول ماهية البيانات وامعلومات المستمدة منها التي يقومون بإنتاجها وجمعها عن 
الناس وكيفيه توظيفهم هذه البيانات وطرق بيعهاء وأصدرت تقريرا يدعو للخصوصية 
عند التصميم (انظر الفصل العاشر)ء وخيارات مبسطة. وقدر أكبر من الشفافية (لجنة 
التجارة الاتحادية 2012 .(Federal Trade Commission‏ وعلاوة على ذلك. فقد تم 
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تطبيق الضغط السياسي لاعتماد أنظمة أشذ رقابة وأكثر شفافية. أما في أوروباء فيسعى 
قانون الاتحاد الأوروي الجديد لحماية البيانات لتنظيم LAS‏ استخدام البيانات» ومنح 
المواطنين الحق في الوصول إلى البيانات والتنازع عليها والحق في تناسيها وحذفها (انظر 
الفصل العاشر). وسيعتمد مدى نجاح مغل هذه الأعمال على إعادة تشكيل أعمال وسطاء 
البيانات والذي Ioas s‏ عنه الزمن لحا وق غضون 45« هناك العديد من الأاستلة 
المتعلقة بوسطاء البيانات والأسواق وآثارها على ال مواطنين والمستهلكن التي تحتاج إلى 
استكشاف للإجابة عنها (انظر الفصل السادس). 


الخلاصة: 

على الرغم من الدعوات المنمقة لمؤيدي البيانات الكبيرة وأولويات التمويل للوكالات 
البحثية: فإن البيانات الصغيرة ستستمر بالتقاء تاعقنارها 1 ا حو دا في فضاء البحث 
العلميء فدراسات البيانات الصغيرة قد تكون محدودة في الحجم» ومحصورة من حيث 
عيناتها وتنوعهاء وثابتةء.وغير diya‏ مجرد تنفيذهاء ولكنها خدمت:العلوم بشكل جيد حتى 
وقتنا الحاضر لأنها مصممة خصيصا للرد على أسئلة مركزة بإحكام. ويتيح إنتاج البيانات 
الصغيرةء جنبا إلى جنب» مع أدوات التحليل الجيدة, للباحثين التنقيب الدقيق وبشكل فعّال 
à‏ مستويات محكمة من البيانات العالية الجودة من أجل فهم العالم. وق LELI‏ وكما 
نوقش في الفصل الثامن» تسعى العديد من دراسات البيانات الكبيرة إلى الإجابة عن الأسئلة 
التي يمكن الإجابة عنها من البيانات المنتجة؛ فكما قيل: الذيل الآن هو الذي يهز الكلب. 

ومع «US‏ فمن الواضح أن رؤى وقيمة أكبر بكثير يمكن الحصول عليها من البيانات 
الصغيرة من خلال توسيع نطاقها في البنى التحتية للبيانات والاحتفاظ بها للأجبال القادمة. 
às‏ حين أن البيانات ولفترات طويلة قد جُمعت معاء وجرى تخزينها وأرشفتهاء إلا أن 
تطور التقنيات الرقمية قد غير بشكل جذري قدرتنا على إدارة» وتنظيم» ومعالجة» وتحليلء 
ومشاركة» وإعادة استخدام البيانات» وخاصة تلك البيانات التي ولدت رقمية في «Joey‏ 
فقد كانت البيانات الصغيرة فيما سبق نادرة ومقيّدة: ولكنها غدت متوافرة بشكل SÍ‏ 
وأكثر انفتاحا (انظر الفصل الثالث). وبتوسيع نطاق هذه البيانات يمكن تحقيق جدوى 
اقتصادية وذلك فيما يتعلق بخدمات البيانات» وأدوات التحليل واموارد التربوية» وتوضيف 
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البيانات في استخدامات جديدة» وإنتاج اكتشافات جديدة. ونتيحة Jio «eX‏ الآن جهد 
كبير لإنتاج البنى التحتية للبيانات في جميع المجالات الأكادممية. وهو الجهد الذي من شأنه 
أن يُتيح بشكل أكبر بكثير البيانات للمجتمعات المعنية وأن gss‏ طبيعة عمل العلوم (انظر 
الفصل الثامن). 

ويتضح الممدى الذي يمكن من خلاله لهذا التوسع إنتاج قيمة من خلال النمو السريع 
لقطاعي وساطة البيانات والتحليلات المصاحبة لها. حيث يمكن لوسطاء البيانات» من خلال 
الجمع بين مخازن كبيرة من البيانات الصغيرة التي تحتفظ بها المؤسسات العامة والشركات 
الخاصة ودمجها جنبا إلى جنب مع مجالات تدفق البيانات الكبيرة: إنتاج مختلف أنواع 
الملفات التعريفية التفصيلية للأفراد والمجموعات والتي يمكن استخدامها للاستهداف المركز 
للأسواق» وتقسمهاء وفرزهاء مما يوفر معلومات ذات قيمة عالية للعملاء. كما تكشف هذه 
الممارسات عن بعض القضايا وا مخاطر الناجمة عن التوسع في نطاق البيانات» وبالتحديد 
استخدامها لغير الأغراض التي جمعت لأجلهاء وأمنهاء والفرص الجنائية في حال تم سرقة 
البيانات. حيث $ VY‏ أي من هذه القضايا وا مخاطر JS o‏ تام حتى «JUI‏ مع ضعف 
الجانب التنظيمي والإجراءات المضادة. 

فهناك العشرات من:الأسئلة التي تتطلب اهتماما بشأن الدور المستقبلي وطبيعة 
دراسات البيانات الصغيرةء وتوسيع نطاق البيانات الصغيرة إلى أشكال مختلفة من البنى 
التحتبة للبيانات والآثار المترتبة عليهاء والعواقب الناتجة عن حفظ البيانات والوساطة 
فيها على أساس الربح. ومع ذلكء فمن الواضح أن التحليل النقدي للتغيرات التي تحدث 
ليست مواكبة للتطورات التقنية والتجاريةء فالواقع أنه حتى الآن كان هناك عدد قليل من 
الانطباعات النقدية المبنية على أساس التفكير من خلال الآليات والدلالات ف كيفية إنتاج 
البيانات الصغيرة» وتوسيع نطاقها واستخدامهاء والتنظير لأدواتها - قواعد البيانات والبنى 
التحتية للبيانات - التي يتم استخدامها لتنظيم وتبادل وتحليل البيانات. ونتيجة لذلك 
هناك ندرة في المعرفة المتعلقة بالأنظمة الاجتماعية التقنية الناشئة والمعقدة التي يتم 
إنشاؤهاء مع عدد قليل من دراسات الحالة المعمقة. ومن ثمء يتضح أن هناك حاجة للكثير 
من البحث والتأمل لفهم البنى التحتية للبيانات في جميع أشكالها. 
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السانات المفتوحة (Open Data)‏ والسانات المرتىطة (Linked Data)‏ 


بالنظر إلى التكاليف والنفقات واموارد المطلوبة لإنتاج مجموعات البيانات وقيمتها في 
الكشف عن معلومات عن العام من حولناء فقد تم بشكل عام تقييد الوصول إليها بطريقة 
أو بأخرى» فعلى سبيل JELI‏ يتاح الوصول للمستخدمين ال مسجلين المعتمدين فقطء أو من 
خلال المطالبة برسوم اشتراك» أو عن طريق حصر الكيفية التي يمكن فيها استخدام البيانات 
بواسطة السياسات والتراخيص. وحتى laxe‏ كانت مجموعات السانات متاحة ومفتوحة 
CES‏ فقد كانت تتطلب معدات وأدوات متخصصة لفهمها والوصول dd!‏ مثل أجهزة 
الحاسبء والبرمجيات» وامهارات المتعلقة بطرق الإحصاء ورسم الخرائط s Als‏ 4$ السياقية 
للحقل أو الموضوع الذي يجري التطرق إليهء مما يتعذى بكثير قدرات عموم الناس. ونتيجة 
«eJ‏ كانت البيانات واممعلومات المستمدة منها تقليديا مغلقة إلى do‏ كبير بطبيعتها - أي 
مقفل عليها داخل مؤسسة أو محفوظ أرشيفي. وف الواقع» فقد مثل عدم إتاحة الوصول 
إلى مجموعات البيانات التي يمكن أن تساعد في الإجابة.عن أسئلة معينة مصدر إحباط على 
مدى قرون للباحثينء والمحللين. والصحفيين» ومنظمات ال مجتمع GI‏ 

o‏ ومن هذا ا منطلق سعت حركة البيانات المفتوحة لتحويل هذا الوضع جذريًاء ليس 
فقط من خلال فتح البيانات وإتاحتها لإعادة استخدامها على نطاق أوسع فقطء ولكن أيضا 
من خلال توفير أدوات بحثية سهلة الاستخدام والتي لا تتطلب الحاجة إلى مهارات تحليلية 
متخصصة. وبنيت هذه الحركة على ثلاثة مبادئ هي: الانفتاح» والمشاركة. والتعاون 
Cal)‏ الأسض 2009 «(White House‏ فمن خلال الشفافية:» aS ila‏ والعمل T‏ مكن 
إدراك قيمة البيانات للمجتمع. وتهدف الحركة إلى تحرير القدرة على إنتاج المعلومات 
AS hlo‏ بدلا من حصر إمكانية الاستفادة من قوة البيانات على منتجيها أو أولئك الذين 
يمكنهم دفع تمن إتاحة الوصول إلى البيانات. وقد تركز الاهتمام» على وجه الخصوص» على 
فتح البيانات التي تم إنتاجها من قبل أجهزة الدولة وغالبا ما يطلق عليها معلومات القطاع 
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العام (Public Sector Information - PSI)‏ أو البحوث الممولة من القطاع العام (انظر 
الفصل (GUI‏ مع الأخذ بالحسبان ob‏ هذه البحوث قد تم تمويلها من قبل الخزينة العامة 
لفائدة عامة الناس» مع تركيز أقل على فتح البيانات التي تم إنشاؤها من قبل القطاع 
الخاص» والتي قد يكون لديها قيمة خاصة أكبر عند منتجيها على وجه الخصوص. 

وقد تطورت حركة البيانات المفتوحة خلال العقدين اماضيينء بالتزامن مع - ولكن مع 
فصل واضح إلى حد كبير عن - حركة الحق ف المعلومات (Right to Information-RTI)‏ 
ا معنية باتخاذ قرارات الشفافية وصنع السياسات من قبل الوكالات وا معروفة أيضا باسم 
حرية اممعلومات (Freedom of Information)‏ وحركتى امصدر المفتوح والعلوم ال مفتوحة 
المعنيتين بإعادة تشكيل البرمجيات والنشر إلى أشكال مفتوحة وشفافة فيما يتعلق بالترخيص, 
وحقوق الطبع والنشىرء وحقوق الملكية الفكرية. فمنذ اواخر سنة 2000م: اكتسبت حركة 
البيانات المفتوحة مكانة بارزة وزخم ثابت بشكل ملحوظ ابتداء من حملة صحيفة 
الغارديان في المملكة المتحدة تحت مسمى" تخليص بباناتنا- Free Our Data" (www.‏ 
(theguardian.com/technology/free-ourdata‏ ودعوة منظمة التعاون الاقتصادى 
والتنمية (Organization for Economic Cooperation and Development - OECD)‏ 
حكومات الدول الأعضاء لفتح بياناتها في عام 2008 «e‏ وإطلاق الحكومة الأمريكية ف العام 
9 للموقع الإلكتروني (www.data.gov)‏ وهو موقع على شبكة الإنترنت صَمّم لتوفير 
الوصول إلى مجموعات البيانات غير الحساسة والتاريخية التي تحتفظ بها أجهزة الدولة 
على مستوى الولايات ومستوى الحكومة الفيدرالية بالولايات المتحدة الأمريكيةء وتطوير 
البيانات اممرتبطة والترويج ل الويب الدلالى pass (Semantic Web)‏ موحد لتكنولوجيا 
الانترنت في المستقبلء والذي يمكن البيانات المفتوحة والبيانات المرتبطة من أن تتصل في 
الغالب بشكل طردي )2009 .(Berners-Lee‏ ومنذ عام 2010 «e‏ حذت حذوها عشرات 
الدول وامطنظمات dJa dl‏ على سسل «JUI‏ دول الاتحاد الأوروبي European Union-)‏ 
(EU‏ وبرنامج الأمم امتحدة الإغمالى United Nations Development Programme-)‏ 
(UNDP‏ مما جعل الالاف من مجموعات اليانات المقيدة UTER‏ متاحة ومفتوحة بطبيعتها 
للاستخدام غير التجاري والتجاري (انظر 2013 .(DataRemixed‏ وقد أسهم في مثل هذا 
التحول في الموقف مجموعات الضغط الدولية والوطنية المؤثرة مثل مؤسسة d$ sil‏ المفتوحة 
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(Sunlight Foundation) ومؤسسة ضوء الشمس‎ (Open Knowledge Foundation) 
من المجموعات والشركات العاملة في مجال الاقتصاد ا معرف. بالإضافة إلى‎ Ja so ورافقه‎ 
موظفي الخدمة المدنية المقتنعين بالحجج ال مستخدمة: وعشرات الجماعات ال محلية التى‎ JLS 
تسعى للاستفادة من السانات امدنية.‎ 

وق حين يتم عرض حجج حركة البيانات المفتوحة بطريقة بديهية. باستخدام مفردات 
الاستعارة البلاغية مثل الشفافية: واطمساءلةء وا «AS JL‏ والابتكار, والنمو الاقتصاديء فإن 
الانفتاح السريع للبيانات الحكومية والعلمية لمم يلق Y dte Ls‏ فالواقع, أن العديد 
من الاثار الاجتماعية والسياسية والاقتصادية لفتح البيانات يجري حاليا الكشف عنها 
ومناقشتها وانتقادها. وعلاوة على ذلكء: وللمفارقة إلى حد do‏ تعزز نطاق ومدة حقوق 
ا ملكية الفكرية على مدى نصف القرن الماضيء بمعنى أن نمو خركة البيانات المفتوحة تم 
بالتوازي مع زيادة في حقوق الملكية الفكرية )2006 (Pollock‏ فامقاومة التي واجهتها 
فكرة توفير حرية الوصول إلى البيانات العلمية نوقشت في الفصل السابق» وسيتم في القسم 
الآخير من هذا الفصل مناقشة الانتقادات الموجهة لدعوى البيانات المفتوحة. قبدايةء ومع 
ذلك» يحدد هذا الفصل خصائص السانات المفتوحة والسانات dha hl‏ ومختلف الطرق 
التي duai) WIN‏ السانات ال مفتوحة. والاقتصاديات ا مرتبطة بتقديم بيانات dies «Ao già‏ 
الرغم من أن فتح البيانات الحكومية ما Lye Jl»‏ فليس هنالك شك في أن الا lS‏ 
يحدث بشأن الكيفية التي تتم من خلالها عرض ومشاركة البيانات بشكل عاة. 


السانات المفتوحة (Open Data)‏ : 
عند أحد المستوبات» Aso‏ تعريف مصطلح البيانات المفتوحة بسيط NE‏ فقد حدده 
بولوك )2006( على سبيل JUL‏ كالتالي: «تكون البيانات مفتوحة إذا كان لأي شخص الحرية 
في استخدامهاء وإعادة استخدامهاء وإعادة نشرها - فقط شرط موافقتها لمتطلب إسنادها 
و/ أو مشاركتها على Ao‏ سواء». ولكن هذا التعريف يلمح إلى الطبيعة المتنوعة ما يمكن 
أن يكون عليه المقصود من لفظة «الفتح» وكيف أنها يمكن أن تعني أشياء مختلفة بالنسبة 
مختلف الوكالات في سياق حقوق الملكية الفكريةء فقد يشير الانفتاح إلى الاستخدام 
أو إعادة الاستخدام» أو إعادة الصياغة. أو إعادة التوزيع: أو إعادة النشر والتوزيع؛ أو 
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إعادة البيع» وقد يكون لكل منها شروط وأحكام تختص بهاء فعلى سبيل ال مثال قد يكون 
للمستخدم القدرة على استخدام مجموعة البيانات بحرية موجب ترخيصء ولكن ذلك لا 
يعني إمكانية إعادة التعامل مع هذه البيانات بهدف eo JI‏ التجاري أو إعادة egal‏ أو 
أي استخدام قد يتطلب الإسناد. وبعبارة 45,21 قد يكون الوصول إلى مجموعة البيانات 
مفتوحاء ولكن ليس بالضرورة أن يكون كل ما يمكن فعله مع البيانات ال ممكن الوصول إليها 
مفتوح أيضا. وف حالات أخرىء قد تحتفظ ال منظمات ببياناتها وتتحكم بإتاحة الوصول 
إليها بنفسهاء ولكنها تتيح بحرية البيانات الوصفية المتعلقة بها فقطء أو قد تسمح المنظمة 
لبعض المستخدمين بالوصول إلى البيانات» ولكنها لا تمكنهم من إعادة نشرها إلا إذا كان ذلك 
سيحقق قيمة مضافة لها وبدون الوصول إلى البيانات الأولية الأساسية. 

ومع ذلك. سعت عدد من المنظمات إلى تحديد الخصائص امثالية للبيانات المفتوحة.؛ 
على سبيل JULI‏ يؤكد تعريف الانفتاح ob‏ العمل هو مفتوح إذا استوفت حالته في النشر 
الشروط المنصوص عليها في الجدول رقم (Y-Y)‏ والتي تفرض بعض القيود على الوصول. 
والاستخدام» وإعادة الصياغة: وإعادة التوزيع والنشرء وتشجع EUIS‏ بشكل نشط على 
الاستخدام الربحي للبيانات المفتوحة دون آي تعويض مالي طمنشن البيانات الأصلي. وبالمثل: 
حددت منظمة الحوكمة ال مفتوحة (OpenGovData)‏ تسعة مبادئ للسانات ال مفتوحة 
تتعدى مجرد نمط التوزيع إلى النظر أيضا في طبيعة البيانات نفسها (انظر الجدول رقم 
3-2). وبالإضافة إلى هاتين المجموعتين من الشروط / المبادئ: اقترحت وكالات أخرى مثل 
منظمة التعاون الاقتصادى والتنمية )2008( (OECD)‏ والحكومة الأسترالىة Fitzgerald)‏ 
0) حاجة البيانات ا مفتوحة إلى أن تكون مصحوبة بقوائم الأصول وآليات اكتشاف 
البيانات» من أجل إصدار المؤشرات المتعلقة بجودة البيانات وموثوقيتهاء واستخدام النماذج 
وامعايير التي تتيح قابليه التشغيل البيني للبيانات امفتوحة» وتوفير بنى تحتيه سهلة 
الاستخدام للبيانات لتسهيل النشر المنتظم وإيجاد مجموعات بيانات جديدة: بالإضافة 
إلى عدد من الأدوات الأساسية والتخصصية التي من شأنها أن تحسن الاستخدام والتحليل 
للبيانات. ويعد ضمان التشغيل البيني مهما بشكل خاص لأنه يسمح بربط مجموعات 
البيانات المختلفة, مما يُسهم ف بناء مجموعات بيانات جديدة أكثر تعقيدا واكتشاف رؤى 
جديدة dò shl duwga)‏ الطفتوحة 2012 .(Open Knowledge Foundation‏ كما لا توحد 
قيود فيما يتعلق بمجالات التركيز للبيانات المفتوحة - حيث يمكن أن تتعلق بأي مجال 
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من المجالات الاجتماعية» والاقتصادية» والتجارية» والثقافية (وسائل الإعلام وال مكتبات 
والتراث)» والبيتية» أو الظواهر العلمية - ولكن» بشكل «ele‏ ينصب التركيز حتى الآن على 
فتح البيانات التي تتصل بالسياسات العامة عالية المستوى ولها قيمة تجارية عند إعادة 
استخدام مثل السانات ال متعلقة بالاقتصاد. والنقلء والسانات الجغرافية. 
جدول رقم )١-١(‏ 
الخصائص JELI‏ للبيانات ال مفتوحة المتعلقة بتعريف الانفتاح 


إتاحة الوصول Access‏ | ينبغي أن يكون العمل متاحاً بمجموعه ككل وبلا تكلفة إعادة 


إنتاج تتجاوز ال معقول كما ينبغي أن تتوفر بشكل مناسب قابل 
للتعديل 








ينبغي أن لا تقيّد الرخصة أي طرف عن بيع العمل أو 

توزيعه سواء فيما يتعلق بالعمل نفسه أو كان ذلك العمل 

وينبغي أن لا يتطلب الترخيص إتاوة 9l‏ رسوما أخرى لهذا 

البيع أو التوزيع. 

إعادة الاستخدام Reuse‏ ينبغي ol‏ يسمح الترخيص بالتعديل على العمل وإجراء عمليات 
الاشتقاق منه ويسمح كذلك بتوزيع الأعمال المشتقة T‏ لآحكام 
العمل oy‏ 


إعادة التوزيع 


Redistribution 









غياب القيود 4432 Absence‏ | ينبغى تقديم العمل على الصورة التى لا يوجد lgga‏ عقبات 
of technological restrictions‏ | 443 تحول دون استخدامه أو إعادة توزيعه. 


الأسناد Attribution‏ قد eb‏ الترخيص الإسناد إلى اللساهمين وا مبدعين للعمل 
الأصلي كشرط لإعادة التوزيع وإعادة الاستخدام» وإذا تم فرض 
هذا الشرط فينبغي ألا تتطلب عملية الإسناد إجراءات مرهقة 
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الصحة والنزاهة Integrity‏ 


عدم التمسز ضد الأشخاص أو 
ele ss‏ 
No discrimination against‏ 


persons or groups 


عدم التمييز ضد مجالات معينة 
في العمل No discrimination‏ 


against fields of endeavor 


Distribution الترخيص‎ 2:55 
of licence 


عدم تعيين الترخيص على حزمة 
أعمال Licence must not be‏ 


specific to a package 


عدم تقييد الترخيص توزيع 
الأعمال الأخرى Licence must‏ 


not restrict the distribution 


of other works 


من اللممكن أن biis‏ الترخيص حمل الإصدارات اللعدلة للسانات 
أسماء تختلف عن العمل الأصلي كشرط لإعادة توزيعها. 

ينبغي عدم تمييز الترخيص ضد أي شخص أو مجموعة من 
الأشخاص وضمان إتاحة الوصول للجميع. 


ينبغي عدم تقييد أي شخص من الاستفادة من العمل في أي مجال 
معين. على سبيل JULI‏ لا ينبغي تقييد العمل من استخدامه في 
الأعمال التجارية. 


ينبغي تطبيق الحقوق المتعلقة بالعمل على جميع الذين يتم 
إعادة توزيعه عليهم دون الحاجة لتنفيذ ترخيص إضافي من قبل 
تلك الأطراف. 


ينبغي أن لا تعتمد الحقوق المتعلقة بالعمل على كونه جزءا من 


ينبغي أن لا يضع الترخيص قيودا على الأعمال الأخرى التي يتم 
d] Gier Lana js‏ جم دمع العمل i, A‏ على سل DIM‏ 
ينبعي أن لا يضر الترخيص على أن تكون كل الأعمال المستمدة 
RR do gzha za‏ 





المصدر: مقتىس من .http://opendefinition.org/od‏ 
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جدول رقم (Y-Y)‏ 
مىادئ منظمة الحوكمة المفتوحة للسانات المفتوحة 


يجب أن تكون البيانات كاملة تكون كافة البيانات متاحة. مع مراعاة أحكام وشروط 
الخصوصية. والأمن أو قبود الصلاحيات. 


Data must be complete 


يجب أن تكون البيانات أساسية (أولية) | تنشر البيانات كما تم جمعها من uall‏ مع أفضل 
مستوى ممكن من التفاصيل» وليست بأشكال مجملة أو 


معدلة. 


Data must be primary 


يجب أن تكون البيانات فى الوقت | إتاحة البيانات فى أسرع وقت ممكن عند الحاجة لها 
UT‏ للحفاظ على قيمة البيانات. 





Data must be timely 
ممكن من المستخدمين ولأوسع‎ 24e يجب أن تكون البيانات في المتناول | إتاحة البيانات لأكبر‎ 


مجموعة من الأغراض. 











Data must be accessible 
يجب أن تكون البيانات قابلة للمعالجة | تنظم البيانات بشكل مناسب للسماح بال معالجة الآلية لها‎ 
الآلية‎ 
Data must be machine- 


processable 


يجب عدم تمييز عملية الوصول تتوفر البيانات لأي «iol‏ مع عدم اشتراط التسجيل. 


Access must be non- 





discriminatory 


تتوفر البيانات في صيغة لا يكون فيها سيطرة حصرية 
عليها لآي OLS‏ 


يجب أن تكون صيغ البيانات غير 
مخصصة املكية 







Data formats must be non- 


proprietary 
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الفصل الثالث 


يجب أن يكون ترخيص البيانات مجانياً | لا تخضع البيانات لأية أحكام في حقوق التأليف والنشر 

وبراءات الاختراع والعلامات التجارية. وقد يُسمح ببعض 

قيود الخصوصية والأمن والصلاحيات المناسبة بحسب ما 
تفرضه التشريعات الأخرى. 


Data must be licence-free 


يجب أن يكون الامتثال قابلاً للمراجعة | يجب أن يتم تعيين شخص كضابظ اتصال 3,0 على الناس 
وإعادة النظر الذين يحاولون استخدام البيانات أو تقديم شكاوى حول 
انتهاكات ال مبادئ الرئيسية. ويجب أن يكون هناك هيئة 
أخرى ذات اختصاص لتحديد ما إذا تم تطبيق المبادئ 
يكل elis‏ 


Compliance must be reviewable 





المصدر: مقتبس من http://www.opengovdata.org‏ 

وإلى جد كبير. تعد هذّة الخصائص المثالية البيانات المفتوحة مُنتجاء وليست خدمة. وف 
المقابلء فقد جادل )2013( Gurstein‏ حول الحاجة إلى إعادة التفكر بالبيانات المفتوحة 
كعملية خدمية -(Service process)‏ بوصفھا تفاغلا وتنطوي على علاقة بين مزودي البيانات 
وا مستخدم النهائي. فبالنسبة له» لا يكفي أن تكون البيانات ببساطة متاحة من قبل المنظمات 
لإعادة استخدامهاء بل ينبغي أن يكون فتح البيانات موجّها أكثر باعتباره daas‏ مع الأخذ بعين 
الاعتبار حاجات وتوقعات المستخدمين النهائيين منهاء فهذه الإعادة لصياغة ال مفاهيم تقترح 
على أولئك الذين ينتجون البيانات المفتوحة اتباع طرقا مختلفة لإدارة البيانات والمستخدمين 
النهائيين: كالآثار المترتبة على Llas‏ إعادة تحديد المصدر الخاص بالبيانات. فالنسبة a)‏ 
يتطلب هذا النوع من النهج مشاركة ا مستخدمين النهائيين في التخطيطء والتطويرء وإدارة 
المشاريع الجارية للبيانات المفتوحة: وكذلك استخدام مقاييس لتقييم مدى نجاح مثل هذه 
المشاريع في تعزيز الصالح العام» وهذا يتطلب برامج بناء القدرات الرامية إلى رفع مهارات 
المستخدمين ليكونوا قادرين على إدارة ومعالجة وتحليل البيانات بشكل مناسب وفعال. 
ورغم أنه من السهل أن نتفق على أنه ينبغي تسليم البيانات المفتوحة كخدمة» إلا أن 
البيانات المفتوحة بطبيعتها لا تنتج دخلا أو تنتج القليل مقابل تمويل هذه الترتيبات الخدمية 
فضلا عن التكاليف المتعلقة بفتح البيانات» فالواقع أن ذلك قد يكون من الطموح إلا إذا تم 
تطوير نماذج تمويل فعالة (كما نوقش اكثر بالكامل ادناه). 
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البيانات المفتوحة والبيانات المرتبطة 


السانات المرتبطة (Linked Data)‏ : 
Jia‏ فكرة البيانات المرتبطة بتحويل شبكة الانترنت من شبكة الوثائق إلى شبكة البيانات 
من خلال إنشاء الشركة الدلالية )2010 (Semantic web) (Berners-Lee 2009; P. Miller,‏ 
أو ما اصطلح عليه 2010( (Goddard and Byrne‏ مصطلح «امقروءة Ui‏ على شبكة الإنترنت» 
.(Machine-Readable Web)‏ وتدرك هذه النظرة بأن 485 المعلومات التي يتم تبادلها 
على الإنترنت تحتوي على تنوع غنى للبيانات - cele ul‏ وعناوين» وتفاصيل «eil‏ والحقائق 
والأرقام إلى آخره. ومع YUS‏ يتم بالضرورة تحديد هذه البيانات رسميا على هذا النحي 
كما أنها ليست منتظمة رسميا في طريقة يمكن معها جمعها واستخدامها بسهولة فالواقع» أن 
معظم وثائق شبكة الإنترنت غير منظمة إلى o‏ كبير في طبيعتها. ومن خلال ترميز الوثائق 
وهيكلتها باستخدام معرّفات فريدة واستخدام لغة التوصيف «Markup Language)‏ مکن 
جعل البيانات التي تحتويها هذه الوثائق مرئية. وتمكين الآخرين تلقائيا من دمجهاء ومعالجتها. 

وفهمهاء وربطها مع البيانات الأخرى ذات الصلة )2010 (P. Miller,‏ 

ومن أجل تمكين شبكة الانترنت الدلالية من أن تعمل كبيانات مرتبطة» بین Berners-‏ 
Lee (2009)‏ حاجة الوثائق المنشورة على شبكة الإنترنت للمواءمة مع أربعة توقعات 
سلوكة. Yl‏ يجب تعريف الكائنات وا موارد ضمن كل 4259 باستخدام لغة التوصيف 
اموسعة (XML- Extensible Markup Language)‏ وتسميتها بشكل واضح لا لبس فيه 
باستخدام معرفات الموارد الموحدة L6 (Uniform Resource Identifiers -URIs)‏ 
ينبغي استخدام الهيكل الضمني لشبكة الإنترنت Jas J‏ الوثائق والمعلومات (على سبيل 
«JULI‏ استخدام معيار نقل النصوص التشعبية - أتش ت (HTTP) à à‏ ومعرفات الموارد 
الموحدة (URIS)‏ بحيث بمكن التنقيب في الأسماء والبحث فيها). ثالث تسهيل اكتشاف 
المعلومات حول كائن مسمّى أو مورد (على سبيل ا مثال» lasis‏ يقوم شخص بالبحث عن 
معرّف لكائن ماء تقدّم له معلومات مفيدة باستخدام معايير إطار عمل وصف الموارد 
.(Resource Description Framework -RDF)‏ فإطار عمل وصف الموارد هو iog‏ 
تفصّل وتصف طبيعة معرّفات الموارد ضمن نطاق ما وينبغي أن يُحال كل معرّف إلى 
هذه !)4253 لتحصيل معلوماته )2010 (Goddard and Byrne‏ ويضمن استخدام 
هذه المعايير إطاراً مشتركا لجمع البيانات عبر الإنترنت» بدلا من اعتماد مجموعة كبيرة من 
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الفصل الثالث 


الأساليب المتعارضة )2012 dely (Dietrich‏ توفر وصلات للربط بين الكائنات والموارد 
ذات الصلة: إذا كانت s‏ $9« بحيث مكن للمستخدمين ا اف o 3I‏ هن e aM‏ 


وتمكن هذه التوقعات السلوكية من جعل الوثائق مقروءة آليا ويمكن معالجتها بحيث 
يكون التعرف على طبيعة الكائنات فيها ممكنا (على سبيل JELI‏ الولايات المتحدة هي بلد 
وبارآك آؤباما هو شخص). Ihla‏ الغموض عن المفاهيم (على سبيل JEU‏ ارس هو sls‏ 
شوكولاتة؛ والمريخ (مارس) هو كوكب؛ أو أن باراك أوباما هو مؤلف وثيقة مقابل أن باراك 
أوباما هو موضوع وثيقة). وإنشاء روابط وعلاقات داخل البيانات (على سبيل JEBI‏ باراك 
أوباما هو رئيس الولايات المتحدة) )2010 .(Goddard and Byrne‏ وبهذه الطريقة: 
يصبح من الممكن لوثائق شبكة الإنترنت أن تكون قابلة للقراءة UJ‏ بحيث لا يقتصر عمل 
برنامج القراءة على فهم امحتوى ولكن ممكنه أن يستمد Lao]‏ سانات مشتقة جديدة من 
خلال الاستدلال من ال محتوى )2010 (Goddard and Byrne‏ 

وعندما: تنشر الوثائق بهذه الطريقة. مكن استخلاص ا معلومات aS. S ue‏ الإنترنت 
وإعادة تقدهها كبيانات وربظها بطرق لا حصر لها اعتمادا على الغرض. ولكن» وبحسب 
ما دون )2010( P. Miller‏ فإن «السانات امرتبطة مكن أن تكون بيانات «Áo gia‏ ويمكن 
ربط السانات «áo zal‏ ولكن من الممكن Laj‏ للسانات ال مرتطة أن تحمل Lach‏ أو 
غيرها من القيود التى تحول دون اعتبارها مفتوحة»»: أو إتاحة السانات المفتوحة بطرق قد 
لا تجعل من السهل ربط بعضها ببعض. وبشكل «ele‏ فإن آي وثائق مرتبطة ليست متوافرة 
على شبكة الإنترنت أو تقع ضمن نطاق نظام اشتراك مدفوع هي أيضا بيانات مفتوحة 
بطبيعتها. فبحسب ما يرى )2009( Berners-Lee‏ ينبغي أن تكون السانات المفتوحة 
والبيانات المرتبطة متكافئة بشكل مثالي. وإضافة لذلك فقد حدد خمسة مستويات EL‏ 
هذه OLJI‏ كل منها أكثر فائدة وقيمة تدريجيا (انظر الجدول رقم 3-3). وكان تطلعه 
إلى ما أسماة بيانات الخمسة نجوم (المستوى الخامس) - شبكة دلالية عاملة بالكامل. 
ووه تجدر الاشارة 4 أنه بالنسية به إلى العديد من «SUA‏ فان محرد کک على 


عمال ماهرة وموارد اإضافية؛: ath‏ جدددة. 


Mt‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 





NZ 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


البيانات المفتوحة والبيانات المرتبطة 


(Y-Y) الحدول‎ 


المستويات الخمسة OULU‏ المفتوحة والبيانات المرتبطة 


البيانات متوافرة. 





مقروءة آلياً ولكن بصيغة 
حصرية de)‏ سبيل JLI‏ 
فلك ادل 








يمكن تحليل البيانات تعتمد على برامج حصرية 
باستخدام البرمجيات الحصرية | للوصول إليها واستخدامها. 
/ الاحتكارية؛ كما مكن 
تصديرها إلى صيغ أخرى. 
يمكن تحليل البيانات 





هل البيانات على الشبكة: 
ليس BU‏ على 
الشبكة. وليست مرتبطة 
بطبيعتهاء ومن ثم هي 


معزولة. 


مقَرْوءة LJ‏ باستخدام صيغ 
عامة غر حصرية 
(على سبيل «JUL‏ صيغة سي 
إس $- (CSV‏ 


برمجية. 





مقروءة LIT‏ باستخدام ضيغ | يمكن الوصول إلى البيانات | يكن أن تزيد زمن تحضير 
dale‏ غير حصرية واستخدام | من أي مكان على شبكة | البيانات وإدارة البيانات 
امعرفات ووصف اموارد | الإنترنت» ومن السهل ربطها وتبادلها. 
(URIs and RDF)‏ | جنبا إلى جنب مع غيرها من 
البيانات» وإمكانية وصلها 
بالأدوات والمكتبات القائمة. 


مقروءة آليا باستخدام صيغ | كما ف المستوى الرابع» | تحتاج إدارة فعالة للبيانات 
عامة غير حصرية واستخدام | ولكن تصبح البيانات أكثر للحفاظ على الروابط 
امعرفات ووصف اموارد اكتشافا وتمنح ال مستخدمين الداخلة والخارحة. 
ومرتبطة بالبيانات والبيانات | وصولا كاملا إلى مخطط 
الوصفية الأخرى (أنطولوجيا) البيانات 





المصدر: معدلة عن http://sstardata.inio.‏ بواسطة .Michael Hausenblas‏ 
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الفصل الثالث 


الدغوّى نحو السانات المفتوحة: 
في حين كان لدى بعض البلدان» مثل الولايات المتحدة. تقليد عريق في de>‏ بعض 
بيانات القطاع العام متاحة بحريةء وخاصة البيانات ذات الفائدة العالية مثل بيانات 
التعداد. ورسم الخرائطء والطقس.ء فإن إتاحة الوصولء في بعض البلدان الأخرى» يتم بشكل 
عام من خلال نموذج تغطية التكاليف الذي يتيح البيانات مقابل مالي وبمموجب اتفاقية 
ترخيص معتمدة. ففي المملكة المتحدة: تخضع الوثائق الحكومية لحقوق التأليف والنشر 
الملكية (Crown Copyright)‏ وتحكم البيانات ذات الفائدة العالية بواسطة الصناديق 
التجارية (على سبيل JELI‏ بيانات الخرائط ضمن هيئة المسح الجغرافيةء وبيانات أحوال 
الطقس في مكتب الأرصاد الجوية) التي تعمل بصفة كيانات احتكارية» وتتحكم في الوصول 
إلى مجموعات انات رئيسية )2006 .(Arthur and Cross 2006; Pollock‏ وعلى مدى 
العقدين «sell‏ تم تجميع مجموعة من الحجج لبناء دعوّى إعادة صباغة دور هذه 
الصناديق وفتح بيانات القطاع العام للجمهور. وبصفة Sue «dele‏ تقسيم هذه الحجج 
والاستحقاقات في كه کال والتي بنظر GUI‏ على Ul‏ ذات فائدة لكل من حامل 
البيانات والمستخدم النهان. 
أولا: رحيث أن الكثير من 'البياناتفي إطار.الهيئات:العامة والمنظمات ,غير الحكومتّة تتعلق 
بالعمليات التشغيلية لتلك الهيئات» فهي توفر وسيلة يمكن من خلالها قياس مدى 
نجاح مختلف البرامج والأنشطة الخاصة بها. ولذا فإن فتح هذه البيانات للتدقيق 
والرقابة العامة سيجعل أعمال المنظمة وصنع القرار فيها تتمتع بالشفافية ويمكن 
استخدامه لتعزيز المساءلة وتقييم القيمة الناتجة مقابل JU.‏ مستثمر Janssen)‏ 
Gordon 2013‏ :2012). وقد تزايدت أهمية هذه الشفافية وامساءلة في الخطاب 
العام في عصر سياسات التقشف ومحدودية امموارد» وف سياق امناقشات الجارية 
حول «ob zl‏ والهدرء والعجز الظاهر ف الخدمات العامة. 


ثانيا: يسمح إتاحة الوصول للمستخدمين النهائيين لبيانات المنظمة» على زعم البعض, 
برفع مستوى الوعي حيال القضايا SLI‏ مما يسهل الاختيار وصنع القرار فيما 
يتعلق بالخدمات العامة. ويشجع على المشاركة الفاعلة والواعية في المجال العام 
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البيانات المفتوحة والبيانات المرتبطة 


.(Janssen 2012: Yiu 2012)‏ وعلاوة على ذلك» فإن إتاحة الوصول للمستخدمين 
النهائيين لبيانات ال منظمة يعزز المواطنة الفاعلة وا مشاركة السياسية في تشكيل 
كيفية أداء وتنظيم الحكم المحلي )2011 .(Huijboom and Van der Broek‏ 
وهذه» بدورهاء تشجع الابتكار الاجتماعي. وتعمل على تعزيز العلاقات بين أفراد 
المجتمع: ورفع مستوى النقاش العام )2012 (Yiu‏ ونتيجة لذلك» تمكن البيانات 
امفتوحة من بناء الدموقراطية éll‏ على المشاركة. 


: يشجع فتح البيانات حول المنظمة وأدائها على استخدامها هذه البيانات للاستفادة 


في تحسين الكفاءة التشغيلية والإنتاجية من خلال ال مراقبة واتخاذ القرارات بالأدلة 
coL ls‏ المشتة. وعلاوة على ذلك» تحصل وحدات الأعمال داخل المؤسسة على 
حق الوصول di‏ البيانات وإمكانية استخدامها عبر المنظمة بكاملها؛ مما يؤدي إلى 
رؤى ومعارف جديدة ومزيد من التفكر المشترك والكفاءة );2012 Northcutt‏ 
.(Verwayen et al. 2011‏ وإضافة لذلك» فإنه مكنهم اكتساب ملاحظات وردود 
قيّمة وتلقي النصح والمشورة من الوكالات الخارجية التي تقوم باستخدامهاء وتحليلها. 
وتفسيرهاء مما يرفع من مستوى Sogl‏ والنزاهة» والفائدة من البيانات. وتؤدي 
هذه التحليلات الداخلية والخارجية إلى تعزيز الحوكمة التنظيمية وإدارة المجتمع 
على نطاق أوسع. على سبيل JUNI‏ التصدي للغش والتزوير والجرائم الأخرى من 
خلال إنشاء خدمات أكثر فعالية )2011 .(Huijboom and Van der Broek‏ كما 
أنها تمكن من الرصد والتقييم المستمرين SY‏ السياسات والبرامج الجديدة (مؤسسة 
امعرفة اطفتوحة 2012 (Open Knowledge Foundation‏ 


رابعا: كن توفير البيانات ال مفتوحة من إثراء العلامة sl‏ 65( فإتاحة البيانات بحرية يرفع 


من شأن المنظمة: ويدلل على ريادتهاء وروح المبادرة فيهاء ويخدم مهمتها العامة 
ويزيد مستوى الاتصال والتفاعل مع العملاءء والملستخدمين النهائيين ويقود التوجه 
إلى الخدمات المؤسسية )2011 (Verwayen et al.‏ وق المقابلء يبني هذا الثقه 
والسمعة. ويعمل على تكوين انطباع عن اطعايير الفاضلة للمؤسسة. 
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خامسا: بينما تمتلك بعض مجموعات البيانات المنشئة والقائمة في العلن قيمة اقتصادية هامشية 
على سبيل امثال تلك المتعلقة بالتراث الثقاق» فإن الكثير من مجموعات البيانات الأخرى 
لديها قيمة تجارية كبيرة. ويمكن استخدام البيانات التي & إنشاؤها علنا لإضافة قيمة 
إلى البيانات التجارية القائمه. وإنشاء تطبيقات وخدمات جديدة ومن ثم أسواقا TENC‏ 
وتحسنن المعرفة واتخاذ القرارات للأعمال )2012 Yiu‏ :2012 7135562). ولذا فليس من 
المستغرب عندئذ حرص المصالح الصناعية على الدعوة لفتح البيانات ال منتجة علنا لإعادة 
استخدامها في القطاع التجاريء. وخاصة البيانات التي UU‏ غرفت باحتوائها وإمكانية 
إنشائها لقيمة كتلك التي تدار من قبل صناديق تداول القطاع العام (على سبيل JE‏ 
بيانات الخرائط). فهناك من يزعم بأن تقييد الوصول إلى البيانات العامة: والتي تم إنشاؤها 
من أجل المصلحة العامة يخنق الابتكار ويعمل على فقدان وزن مميت للاقتصاد؛ أي أن 
حضر استخدامها فقط طن لهم القدرة على تحمّل تكلفتهاء هو تسعير لإخراج الآخرين من 
السوق )2012 .(Pollock 2006: Yiu‏ ولذا OL‏ الاستثمار العام في إنتاج البيانات لم يستغل 
بالشكل المناسب كما تم فقدان العديد من الفرص التي من شأنها أن تضفي قيمة على 
نشاطات القطاع الخاص )2012 .(Yiu‏ وإضافة إلى «AJ5‏ فقد تأثير الارتفاع على الاقتصاد 
الشامل نتيجة فقدان القيمة الناتجة عن فتح البيانات العامة )2012 (Northcutt‏ 


وتتفاوت كيفية احتساب أوزان هذه الحجج الخمس عندما يتم تقديمها عر السلطات 
القضاشة والسياقات ا مختلفة؛ ومع CUS‏ فهى تشكل مجتمعة نظاما ذا منطق قوی حقق 
U5 sls lolo:‏ في إقناع ا منظمات لفتح البيانات الخاصة بهاء لأسباب ليس أقلها أنها تتو 
مع العمليات الجديدة للخصخصه (Newliberalism)‏ التي 55s5‏ تسويق الخدمات e‏ 
(Bates 2012)‏ وق الواقع» فإن 3,2 للحجج المتعلقة بفتح البيانات في الغالب هي 
امصالح السياسية والتجارية التى تهدف إلى دفع ال مؤسسات العامة والمنظمات غير الحكومية 
للحصول على وصول إلى سلعة ثمينةء بدلا من السعي لتحدي مفهوم الملكية الفكرية في > 
ذاتها )2011 .(Verwayen et al.‏ 

في «lll‏ ومما لا يثير الدهشة ف هذا السياقء أن الحجج والدعاوى لقطاع الأعمال 
لإتاحة بياناتها بحرية لإعادة استخدامها على نطاق أوسع b‏ يجر تطويرها والترويج لها 
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على نحو كاف. ومع «AUS‏ فإن العديد من الحجج نفسها لفتح بيانات القطاع العام تصلح 
لبيانات الأعمال أيضاء أو على الأقل عناصر مختارة من هذه البيانات. ففتح البيانات من 
شأنه أن يمكن الشركات من الاستفادة من التحليل والرؤى التي تنتج بواسطة الغير من 
المستخدمين النهائيين» والجمع بين البيانات ومجاميع البيانات الأآخرى التي تعمل على 
إثراتنهم بطرق مثمرة. وتعزيز التعاون مع الشركاء والموردين مما guas‏ فعالية في مجال 
الخدمات اللوجستية وامنتجات الجديدة: وبناء le‏ مع العملاء تساعد على توسيع قاعدة 
العملاء وتعزيز الملف التعريفي للشركة وسمعتها )2012 (Deloitte‏ وعلاوة على ذلك 
فإنها قد تساعد على تطوير الشراكات بين القطاعين العام والخاصء وفي هذا السياق تم 
اعتماد نهج الابتكار المفتوح, والذي حقق نجاحا فيما يتعلق بالبرمجيات المفتوحة؛ والعمل 
على laus‏ أن تقاسم الموارد سينتج ال مزيد من القيمة التجارية دون الحرض على اكتنازها 
بغيرة والتحرز عليها. ففي الحالات التي تلقت الشركات الخاصة أموالا عامة للمساعدة 
في البحث والتظويرء يمكن إقامة دَعْوَى على أن أي بيانات تنتج عن مثل هذه المحاولات 
ينبغي أن تكون مفتوحة إما بشكل كامل وإما بشكل انتقائي كوسيلة لإنتاج سلعة عامة 
لمثل هذا الاستثمار. 


اقتصاديات السانات المفتوحة: 

هناك عدد من العوامل الكابحة / المثبطة لفتح البيانات» فبعض هذه العوامل تتصل 
بالمخاوف المتعلقة بقضايا الضمان والمسؤولية: والمخاوف بشأن الخصوصية «els‏ والحرج 
المحتمل على جودة البيانات أو مداهاء والكفاءة الفنية لبناء واجهات مناسبة لبرمجة 
التطيقات (Applications Programming Interfaces- APIs)‏ وإدارة dal‏ التحتية. 
وحتى الآنء فالأمر الأكثر إثارة للقلق. مع ذلك. هو الشأن YU‏ فالبيانات قد تكون غير 
متنازعة بطبيعتهاء مما يعني أنه من الممكن توزيعها بتكلفة هامشية. نظريا على JEVI‏ 
ولكن ينبغي الدفع مقابل النسخة الأولية جنبا إلى جنب مع إدارة البيانات القائمة وخدمة 
العملاء )2006 .(Pollock‏ وعلى هذا النحوء قد EE‏ السانات المفتوحة موردا مجانا 
للمستخدمين النهائيين» ولكن إنتاجها ومشاركتها والمحافظة عليها هي بالتأكيد ليست دون 
تكلفة معتبرة (خصوصا فيما يتعلق بالتقنيات المناسبة والموظفين المهرة). ففي كثير من 
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الحالات» كانت هذه البيانات أيضا مصدرا رئيسيا للدخل للمنظمات» وف حالة الشركات 
ميزة تنافسية. زمن ثم يرتكز السؤال الأساسي حول كيفية تمويل مشاريع فتح البيانات 
على نحو مستدام في JB‏ عدم وجود مصادر الدخل امباشر لها. ولذا هناك وجهان لهذه 
المعضلة في التمويل: فمن ناحية هناك التمويل اللازم من قبل الدولة لإنتاج البيانات وجعلها 
مفتوحة. ومن ناحية أخرى هناك التمويل للحفاظ على الطبادرات التي يقودها ال مواطنون: 
والذي يعتمد على العمل التطوعي والطمنح» ونماذج الأعمال التي من شأنها تمكين الشركات 
التي تستخده البيانات المفتوحة من الازدهار والتطور. 

ويختلف تمويل خدمات البيانات الحكومية بين البلدان والوكالات. ففي كثير من الحالات» 
تفرض الضرائب لإنتاج ومعالجة البيانات. ولكن في بعض النظم القانونية والحالات» تكون 
خدمات البيانات معقدة بسبب أربعة عوامل: الأول أن إجراءها يتم بالتعاقد عليها مع 
أطراف ثالثة لإدارتها وتشغيلها بالنيابة عن الدولة» حيث يضف الطرف الثالث قيمة 
مخصصة احتكارية أو يجعل البيانات متاحة مقابل رسم Jle‏ وقد حدث هذا مؤخرا مع 
الرموز البريدية الأيرلندية المرتقبة التي سيتم إدارتها من قبل إحدى الشركات نيابة عن 
الدولة وستمول هذه العملية من خلال بيع وترخيص البيانات. الثاني» أن البائعين الآخرين 
يتكتلون بنشاط في سبيل وقف تقديم البيانات المفتوحة لأنه يدمر نموذج أعمالهم. ثالثاء أن 
بعض أجهزة الذولة تعمل باعتبارها صناديق تداول تجارية» فهي لا تحصل على كل تمويلها 
من عائدات الضرائب» ولكن جزءا كبيرا من دخلها قائم على بيع البيانات. فهيئة المساحة 
الأيرلندية» على سبيل «JUL‏ تعمل بهذه الطريقة كون أقل من نصف دخلها o‏ مباشرة من 
الدوله في شكل Alel‏ ومن المسلم به أن بعض هذه الدفعات التي تتلقاها gb‏ من وكالات 
حكومية أخرىء ولكنها Gb‏ أيضا من المؤسسات الخاصة وعمليات الشراء الفردية. فإتاحة 
جميع البيانات الخاصة بها مجانا يقوّض قدرتها على العمل وتمويل الخدمات الجارية 
لها. رابعاء أن جعل البيانات مفتوحة لا يتمثل بنشرها في شكل محدّد من قبل الدولة 
فقط. فالكثير من البيانات تحتاج إلى إعادة توظيفها وتنسيقها لتمكينها من أن تكون 
مفتوحة (على سبيل JELI‏ إبهام المصدر لهاء وتجميعها) ووضع أنظمة جديدة في مكان 
ا مناسب لتحقيق هذا الهدف. وهذه ليست عملية هيْنةء وف أوقات التقشف وخفض 
النفقات يعني هذا إعادة تخصيص التمويل لتغطية تمن هذا العملء. الذي هو ضروري 
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Ee‏ للخدمات الأساسية. وتعني هذه التعقيدات الأربعة أن التصريحات. في كثير من 
الأحيانء بأن جميع بيانات الدولة قد تم بالفعل تغطية كلفها من خلال فرض الضرائب» 
وأنه ينبغي أن تكون متاحة بحرية. هي ليست بسيطة كما يُراد لها أن تكون. أما فيما 
يتعلق بالمبادرات التي يقودها ا مواطنون» فهذه أيضا لديها تكاليف فيما يتعلق بالتوظيف 
والمعدات والخدمات إذا أريد لها أن تكون مستدامة على المدى الطو ub‏ فكيفية تأمين 
هذه اموارد خارج نطاق العمل التطوعي والهدابا تشكل lus buas‏ حيث تعتمد هذه 
ا منظمات. في الوقت الحاضر. إلى حد كبير على التبرعات الخيرية وتمويل الدولة. والتي لا 
يحمل LÌ‏ منها ضمانات للتجديد والاستمرار. ومن 93« فمن النتائج المحتملة المترتبة على 
التخفيضات أو التقلبات ف القاعدة المالية لخدمات البيانات المفتوحة الانخفاض ف جودة 
البيانات» وبط e‏ الاستجابةء والابتكار, والأداء العام )2006 (Pollock‏ 

وعموما Sls. ES‏ للسآئات المفتوحة بان الخار الأفضل ils S Eiin E‏ مستقرة 
للبيانات ال مفتوحة من داخل الدولة وخارجها هموعن طريق الإعانات الحكومية المباشرة 
لتكاليفها. ويرى أنصار هذا النهج أن زيادة الإنفاق العام يعوّض في أربع طرق: الأولى» أن 
إتاحة الوصول المباشر إلى البيانات يحد من بعض التكاليف التي يتكبّدها المنتجون. مثل 
التوظيف المطلوب للتسويقء والمبيعات» والتواصل مع العملاءء ومراقبة شروط وأحكام 
الترخيص )2006 (Pollock‏ الثانية: أنه هكن للنموذج المفتوح الاستفاذة من العمل 
الإضافي الحر والابتكار من جموع ا مستخدمين التي تضيف قيمه معتبرة إلى مجموعات 
السسانات وللمنظمات من ål‏ جودة البيانات» وتحليلهاء والمعرفة المستمدة: وال منتجات 
الجديدة والابتكارات» والعلاقات والشراكات التجارية الجديدة );2011 de Vries et al.‏ 
(Houghton 2011‏ الثالثةء آن البيانات ال مفتوحة تنتج قيم فانضة متنوعة للمستهلكينء كما 
تولد سلعا dale‏ مهمة تستحق استثمار النفقات العامة فيها )2009 .(Pollock‏ الرابعة» أن 
البيانات المفتوحة تؤدي إلى منتجات مبتكرة جديدة من شأنها إنشاء أسواق جديدةء وهذا 
بدوره سوف ينتج مداخيل للشركات وإيرادات ضريبية إضافية. وستكون هذه الإيرادات 
الضريبية فائضة عن التكاليف الحكومية الإضافية في فتح البيانات» وبعبارة أخرى فإن نهج 
التكلفة الصفرية أو الهامشية هي أكثر فائدة على المدى الطويل من إستراتيجيات تغطية 
AJKI‏ واستردادها (المفوضية الأوروسة 2012 (European Commission‏ 
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ولذاء يعتقد أن فتح البيانات ينطوي على إمكانية إيجاد عدة عشرات المليارات من اليورو 
list a‏ في منطقة الاتحاد ETSEN‏ وحدها (مؤسسة امعرفة ال مفتوحة Open Knowledge‏ 
.(Foundation 2012‏ ومن الأمثلة المستخدمة لدعم هذا الاعتقاد هو قرار الولايات 
امتحدة بإتاحة بيانات نظام تحديد المواقع العالمية والطقس للجمهور بحرية Pollock)‏ 
c» .)2006: de Vries et al. 2011‏ يدعم كل ls‏ صناعات مليارات الدولارات والتی 
تولك إدراذات فة كنرة وتوظق أعذآدا كثيرة من الففمال, :وقد ENE‏ تومت 
(The Economist)‏ في العام 2013م بأن GG‏ ملايين وظيفه ف الولايات المتحدة وحدها 
تعتمد على نظام تحديد المواقع. فلو أن أحدا قارن استخدام بيانات الطقس العامة في 
الولايات المتحدة وأوروباء فهناك فرق شاسع في استخدامها وإنتاج قيمة مضافة dgis‏ حيث 
يشير )2006( Pollock‏ إلى أنه في حين " تساوي الاقتصادين تقريبا في الخجم فإن صناعة 
أحوال الطقس التجارية في الولايات المتحدة هي أكبر بعشر مرات من نظيرتها في أوروبا كما 
أن صناعة إدارة مخاطر الطقس الوليدة هي Üle SÍ‏ مرة منها في أوروبا”. وبعبارة آخرىء 
تم استخداء البيانات العامة المتاحة علنا با مجان أو بقيمتها الهامشية بطرق أنتجت عنها 
قيمة إضافية كبيرة. فأسواق البيانات المفتوحة تتعلق على حد سواء بأغراض مرتفعة (وهي 
dados Bast‏ ين العملا الذدن يدفعون روما كية £6 ماف خا de‏ سيل iJÉU‏ 
المستهدفين بشكل كبير بالتنبؤات الجوية)» وأغراض منخفضة (وهي تستهدف أعدادا كبيرة 
فق الله كه طلا dile duel)‏ مخف شت ال redigo a‏ [نزاقات 
الإعلانات؛ على سبيل «JUI‏ تطبيقات حركة ال مرور) )2011 .(de Vries et al.‏ ويتضح 
التأثير المحتمل لفتح بيانات القطاع العام في أوروبا من خلال دراسة أجريت على واحد 
وعشرين مشروعا للبيانات المفتوحة في عشرة بلدان والتي وجدت أن الانتقال إلى التكلفة 
الصفرية أو الهامشية لتكلفة العمليات التشغيلية زادت عدد المستخدمين ما بين آلف إلى 
عشرة آلاف ف «5l.‏ كما جذبت العديد من الأنواع الجديدة من اطمستخدذمينء ولا سيما 
الشركات الصغيرة والمتوسطة )2011 .(de Vries et al.‏ وهذا يفصح عن أنه على الرغم 
من آن هناك بعض المكاسب الكبرةء فقد بين )2013( Eaves‏ أن غالبية الإيرادات الناشئة 
ستنتج عن سلسلة طويلة من الادخار والكفاءة والزيادة المتواضعة من التدوير. 
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وعلى الرغم من هذه «xod!‏ م يصدر عن هيئة ال محلفين حكم gbl‏ حول ما إذا كان 
فتح جميع بيانات القطاع العام يمكلا اقتصاديا وبشكل مستدام» وخاصة في $34( القصير. 
فهنالك بالتأكيد حالة تتعلق بأن البيانات المفتوحة من ال ممكن تسويقهاء مما يؤدي إلى 
منتجات عالية ومنخفضة المستوى والتي يمكن بالتأكيد أن تنتج مصادر للدخل وفرص 
العمل. ومع «A5‏ وكما بين )2011( de Vries et al.‏ فان متوسط ما dusa‏ مطورو 
التطبيقات من مبيعاتها سنوياً ليس سوى ثلاثة آلاف دولار فقطء مع الأخذ بالحسبان أن 
ثمانين بالمائة من تطبيقات الأندرويد امدفوعة يتم تنزيلها أقل من مئة مرة. وبالاضافة 
إلى ذلك» فقد لاحظوا أنه حتى التطبيقات الناجحة مثل ماي سيتي واي (MyCity Way)‏ 
التي تمّ تحميلها أربعين مليون مرةء b‏ تنتج Uso‏ نهد وبدلا من ذلك يستثمر أضحاب 
رؤوس الأموال في مشاريع محتملة الربح مع الحاجة إلى نموذج مستدام للأعمال. وقد 
يكون من الجَيد أن يستغرق الأمر وقتا لتطوير ابتكارات وأسواق جديدة؛ فعلى سَبيل JELI‏ 
استغرقت الصناعات القاثمة على نظم تحديد المواقع سنوات عديدة لتزدهر وتنضج بعد 
قرار جعل البيانات متاحة ble‏ والذي اتخذ ف العام 1984م: كما قد يكون الحال أن بعض 
السيانات لھا قيمة كبيرة جدا ولكن دون جدوى اقتصادية: مما يستوجب ole‏ عدم استمرار 
اعانتها مالا إذا أريد لها ol‏ تبقى مفتوحة بطبيعتها. 

وقي JB‏ غياب طرح الاكتتابات الحكومية العامة لجميع التكاليف المتعلقة بفتح البيانات 
الخاصة بهاء يجري النظر في حلول تمويلية محتملة أخرى ولا سيما نماذج الأعمال المختلفة. 
فقد بين )2013( Ferro and Osella‏ تمانية نماذج مختلفة لتستخدم: أو قد تستخدم 
لتمويل مبادرات السانات المفتوحة (انظر الحدول .(Y-€‏ ولا تستبعد بعض هذه النماذج 
امختلفة me‏ في حين تعمل نماذج شبه - مفتوحة أخرى على توفير البيانات مانا لإعادة 
الاستخدام غير التجاري» وإلزام معيدي الاستخدام للأغراض الربحية بدفع مقابل مادي» أو 
الدخول في شراكات بين القطاعين العام والخاص حيث يزود القطاع العام البيانات وتقدم 
الشركات الخاصة التمويل والخدمات المضافة لإتاحة الوصول وحقوق إعادة الاستخدام 
(OECD 2008)‏ وف نموذج اخر يمكن بناء تحالف يمتلك مجموعة البيانات» وفرق 
العملء واموارد: والأدوات» ويسهل بناء القدرات» ولكن يتقاضى رسوم العضوية من أعضاء 
التحالف لتغطية الخدمات ذات القيمة ال مضافة المشتركة. ويتوقف اعتماد أي نموذج. أو 
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JUI الفصل‎ 


مجموعة من النماذج» على المجموعة المستهدفة لتحمّل تكلفة إنتاج وصيانة البيانات - 
ا مستخدمينء المحدثين / البائعين او الحكومة - وإذا كانت المنظمة تسعى لاسترداد التكاليف 
كاملة أو جزء هامشيا منهاء أو حتى قيمة أكبر من التكاليف الكاملة التي يمكن استثمارها 
مرة y9‏ ى ف الخدمة )2013 (Pollock 2009; Ferro and Osella‏ 


(Y-£) الحدول‎ 


نماذج التمويل لمبادرات البيانات المفتوحة 


الوصف 

تقدّم للمستخدمين النهائيين منتجا عاليا المستوى أو الخدمات 
التي تضيف قيمة إلى البيانات (على سبيل JELI‏ البيانات 
المشتقةء الأدوات والتحليل) بمقابل مادي: كدفعة مقطوعة 

ثابتة. أو رسوما ia) Sio‏ أو الدفع - مقابل - الاستخدآم» ودون 


AIT‏ امميز / خدمة 


Premium product / service 


استخدام حقوق احتكارية. وهذا ex Qu‏ السانات الحصول 
على مزايا المبادرة والسبق في مجال تسويق وبيع السلع 





ME ON Tu‏ النهائيين مجموعة متدرجه من الخيارات» 
متنا Jae JE) dul] pole acto Dilex Das US‏ 
«JULI‏ ميزات محدودة أو clue‏ من مجموعات (OUI‏ 
مع خيارات أكثر تقدما تحقق قيمة مضافة بمقابل رسم مال. 
تفتح المنتج / الخدمة على سوق أكبر اتساعا وأكثر شعبية 
وا مزيد من الاستخدام العرضي الممتد. مع الاحتفاظ بالخدمات 
/ ا لمنتجات المدفوعة. عالية ا مستوىء المتاحة للمستخدمين 
الأكثر تخصصا. 
المنتجات مفتوحة المصدر تقدم منتجات / خدمات للمستخدمين النهائيين مجانا دون 
مقابل» حيث تدعم من خلال سبل التمويل الأساسية الأخرى 
أو غيرها من eol‏ / الخدمات. 


امنتج Ael‏ / خدمة 










Freemium product / service 





Open source 





Mt‏ 859 البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 


نموذج الهدية الترويجية (البنى 
التحتية على نسق ماكنه الحلاقه 
والشفرات) 
Infrastructural razor and‏ 
blades‏ 


المنصة اللوجهة بالطلت 


Demand-oriented platform 


المنصة ا موجهة بالتزويد 


Supply-oriented platform 


التوزيع lal‏ مع الإعلان 


\Free with advertising 


تطوير العلامة البيضاء 


White-label development 
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البيانات المفتوحة والسانات المرتبطة 


يعرض اطنتج او الخدمة ابتذاء بالمجان أو بقيمة مخفضة 


(ماكنة الحلاقة) مما يشجّع على المتابعة بالاستخدام المدفوع 
مقابل (الشفرات). وقد يكون إتاحة الوصول إلى واجهات 
برمجة التطبيقات باط مجان» ولكن يكلف هذا الاستخدام 
المحوسب المستخدمين على نموذج دفغ المستحقات Yol‏ بأول 
(بحسب الاستخدام)» مع دعم هذا النموذج الآخير (الشفرات) 
للنموذج الأول (ماكنة الحلاقة). 
تقدم خدمات ذات قيمة dòlas‏ عن طريق «CAJAS‏ وتكريرء 
وتوحيدء وربط البيانات مما يوفر مجموعة قياسية من 
الأدوات التحليلية: وإتاحتها من خلال متجر شامل (متجر 
الشباك الواحد) وتحميل المستخدمين التكلفة من خلال 
التسعير المجاني او الممين(تتصاعد تدر یجیاربخټارات 1 و2 
لاكتساب الكفاءة). 
يُعطى مطورو البرمجيات حرية الوصول إلى البيانات لإنشاء 
الخدمات والمنتجات التي يمكنهم بيعها إلى هيئات القطاع 
العام والتي يمكنها بدورها أن تجعلها متاحة للآخرين من 
خلال نموذج المنتجات امجانية. 
eds‏ ال منتجات(7الخدمات leue‏ ولكن يتلقى |المستخد مون 
إعلانا عند استخدام ام منتج / الخدمة (المدرّة للدخل) أو 
تقدم المنتجات / الخدمات من قبل شركات مختلفة وتوصف 
بالعلامات التجارية لها لتشجيع استخدام منتجاتها وخدماتها 









الأخرى (الدعم المتبادل). 


يتم إنشاء منتج / خدمة مخصصة للعميل وتخصص 
لاستخدامه الخاص» مع دفع العميل رسوما لمرة واحدة أو 
اشتراك متضمن تكاليف الصيانة والتحديث. 





. (Ferro and Osella (2013 المصدر: حمعت من‎ 
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الفصل الثالث 


المخاوف المتعلقة بالسانات المفتوحة: 

باستثناء الكيفية اللازمة لتمويل مستدام لمبادرات البيانات ا لمفتوحة. والخسائر 
المحتملة للشركات التى قامت ببناء نماذج أعمال قائمة على إعادة بيع بيانات القطاع العام 
(de Vries et 21. 2011)‏ سيظهر للوهلة الأولى أن هناك عددا WE‏ من السلسات الناتحة 
عن فتح البيانات العامة للجمهور لإعادة استخدامهاء وأن هناك العديد من الإايجابيات. 
ومع «US‏ فقد lo‏ في الظهور EXP‏ عدد من الانتقادات المضادة التى تزعم أن åS o>‏ 
السانات المفتوحة ليست محمودة من الناحية السياسية او الاقتصادية» حيث إن paso‏ 
العناصر زائفة في أهدافهاء وعلاوة على ذلكء أن هناك عددا من التبعات الضارة التي 
كن أن تنجم عن فتح البيانات ويتضرر منها بعض المواطنين. ولا توحي هذه الانتقادات 
بفكرة AGERRE‏ نحو فتح البيانات» ولكن تؤكد على وجوب أن تكون مبادرات 
السانات المفتوحة أكثر a:‏ وتعقلا في إتاحة البيانات. وكيفية استخدامهاء وطرق تمويلها. 
ويمكن تقسيم هذه الانتقادات إلى ثلاث فئات رئيسية: تسهيل البيانات المفتوحة للتوجه 
للخصخصة (تأييد الرأسمالية المطلقة وعدم تدخل الدولة ف الاقتصاد) والهيكلة التسويقية 
للخدمات العامة؛ وأنها تروّج لسياسة توسعية وتزيد سلطة المتسلط؛ وأنها تفتقر إلى 
الاستدامة» والأدوات» وسهولة الاستخدام. 


الخصخصة والهيكلة التسويقية للخدمات العامة: 

برهن )2012( Jo Bates‏ على أن «المبادرات المفتوحة مثل السانات الحكومية المفتوحة 
(Open Government Data -OGD)‏ تظهر كعملية تاريخية؛. وليست وقائع محايدة». 
LSS‏ هو الحال مع كل المبادرات السياسية» فإن سياسة البيانات المفتوحة ليست ببساطة 
بديهية أو محايدة» بل هي ترتكز على عقيدة سياسية واقتصادية. فحركة البيانات ee‏ 
متنوعة وتتكون من مجموعة من الدوائر الانتخاية ذات أجندات وأهداف مختلفةء ولسس 
الدافع من ورائها مجرد أي طرف واحد منها. ومع 43« بينت83]65 ob‏ عامل الشد السياسى 
في حالة حركة البيانات ال مفتوحة في ال مملكة المتحدة كان ue RE‏ بدأت الشركات الكبرى 
تنشط بتكتلها في حملات دعم السانات المفتوحة. وبدأت المبادرات الحكومية المفتوحة 
تنسجم مع برامج التقشف القسري والهيكلة التسويقية للخدمات العامة. فبالنسبة لهاء 
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البيانات المفتوحة والسانات المرتبطة 


قد استولت الأحزاب السياسية وقطاع الأعمال على حركة البيانات المفتوحة لصالح المصالح 
الرأسمالية المهيمنة تحت ستار أجندة / جدول أعمال الشفافية )2012 (Bates‏ 


وبعبارة أخرى: فإن جدول الأعمال الحقيقي لقطاع الأعمال هو الحصول على البيانات 
المنتجة بتكلفة باهظة دون أي مقابلء ومن ثم الوصول إلى البنية التحتية المدعومة 
بشكل كبير مما يمكنهم من الاستفادة من الأرباح» وف الوقت 515« إزالة القطاع العام من 
si‏ اتائ به ب و چ و AT ATE WETERE‏ الل 
من خدمات البيانات (كما في الحالات التي جرى تمويلها من الرسوم وليس من دافعي 
الضرائب). ومن ثم اختفاء التمويل اللازم لدعم الإنتاج والإدارة المحلية الداخليةء تم دفع 
هيئات القطاع العام إلى الاستعانة jolas‏ خارجية لمثل هذه الخدمات من القطاع الخاص 
على أسس تنافسية أو التخلي عن إنتاج البيانات للقطاع الخاص التي عليهم بعد ذلك 
شراؤها منهم )2013 .(Gurstein‏ وهناء يتعين شراء خدمات البيانات والبيانات ا مشتقة 
من البيانات المفتوحة المتاحة بحرية من منشئ البيانات» في الوقت نفسه الذي يتم إفراغ 
المعارف الأولية لبيانات المنظمة. وعلاوة على US‏ وحيث إن البيانات المفتوحة تتعلق في 
كثير من الأخيان da dob‏ الهيئة 5 da‏ وخصوصا xi‏ أشتمالها على مؤشرات قياس الأداء 
الرئيسية» فهي تعمل على تسهيل إصلاح القطاع العام وإعادة تنظيمه مما يعزز الخصخصة. 
وروح الإدارة العامة الجديدة ومصالح القطاع الخاص )2011 (McClean 2011; Longo‏ 
فمثل هذه العمليات» كما بينت )2013( Bates‏ هي جزء من إستراتيجية سياسية مرسومة 
لفتح وإتاحة كافة الخدمات العامة تقريبا للمنافسة بين مزودي الخدمات من القطاع 
الخاص والقطاعات الأخرى. حيث يعمل فتح البيانات الخاصة بالخدمات العامة على تمكين 
مستخدمي الخدمة من استحداث خيارات معلومة ضمن سوق الخدمات العامة على أساس 
التطبيقات التي تعتمد على البيانات التي ينتجها مجموعة من مطورو القطاعات التجارية 
وغير التجارية )2013 التعبير الأصلي). وف مثل هذه الحالات» فإن جدول أعمال الشفافية 
التي يروج لها السياسيون وقطاع الأعمال هو مجرد تعبير مجازيء فإذا كان أي من الطرفين 
مهتما حقا في الشفافية والحكومة المفتوحة فإنه سيكون داعما بالتساوي للحق في حركة 
المعلومات والعمل المتعلق بإفشاء الأسرار )2012 (Janssen‏ وكذلك تخفيف القيود عن 
حقوق الملكية الفكرية على نطاق أوسع )2013 (Shah‏ وبدلاً من ذلك فإن الحكومات 
والشركات بشكل عام مقاومة لهما على حد سواء. 
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الفصل الثالث 


السراسات التوسعية وتمكين الممكن: 

هناك جدل ذو صلة يتمثل ف أن الغالب في حركة البيانات المفتوحة مدفوع من 
وجهة نظر فنية واقتصاديةء ويركز بشكل كبير على إتاحة الوصول إلى البيانات» وليس على 
سياسات البيانات نفسهاء وما قد تكشف عنه: أو LAS‏ استخدامهاء ولمصالح من ua‏ 
(Shah 2013)‏ وبعبارة أخرىء تسعى الحركة بشكل كبير إلى تقديم صورة تظهرها على 
أنها محببة وبديهية, وتعزيز الاعتقاد بأن فتح البيانات بطبيعته شيء جيد في حد ذاته. 
وبالنسبة لآخرين» فإن إتاحة الوصول إلى البيانات هو مجرد وجه واحد فيما يتعلق بمفهوم 
«e bày‏ وعلى القدر نفسه من الأهمية هو ما تتكوّن البيانات caza‏ والكيفية التي يمكن بها 
إنشاء مجتمع أكثر اعتدالا وإنصافا. فإذا كانت حركة البيانات المفتوحة تخدم فقط المصالح 
الرأسمالة من خلال فتح البيانات العامة وتحتفظ بالبيانات الاحتكارية الخاصة خلف 
أنظمة جدران gil‏ (مقابل رسوم الاشتراك) وحمايتها بأنظمة الملكية الفكريةء وتمكن 
بصورة أكبر أولئك SEA‏ بالفعل lays‏ الآخرين منهاء فإنها 9855 قد فشلت في جعل 
المجتمع أكثر دمقراطية وانفتاحاً )2013 (Gurstein 2011; Shah‏ 

ففكرة أن البيانات محايدة وموضوعية في طبيعتها تطرح TA‏ في معظم اممناقشات 
امتعلقة بالسانات المفتوحة olg‏ للكل إمكانية الوضول لهذه البيانات واستخدامها 
.(Gurstein 2011; Johnson 2013)‏ بيد أن القضية ليست IS‏ فمع الاحترام لفتح 
السانات نفسها dle 4255 5575 Johnson (2013) Si‏ من الامتياز الاجتماعي والقيم 
الاجتماعية الكامنة ضمنا ق بيانات القطاع العام فيما يتعلق بماهية البيانات «Anl‏ 
وتعلقها من وماذا Y)‏ سيما في المجالات التي تعمل كأنظمة تخصصية. مثل أنظمة الرعاية 
الاجتماعية: وآنظمة إنفاذ القانون): التي Sa‏ حضالهوا شمن سحموغة Làols Cati Ll‏ 
تلك التي يتم استبعاد مصالحها. وهكذا فإن هياكل القيمة متأصلة في مجموعات البيانات 
والتي تشكل بدورها التصميم والتفسير لها ورها تعمل على نشر المظالم وتعزيز المصالح 
امهيمنة. 

فا مواطنون متفاوتون من حيث إمكانية الوصول إلى الأجهزة والبرامج المطلوبة لتحميل 
ومعالجة مجموعات البيانات المفتوحة» كما Ol‏ لهم مستويات مختلفة من المهارات اللازمة 
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لتحليل» وتأطبرء وتفسير البيانات )2011 .(Gurstein‏ وحتى لو امتلكت بعض ال مجموعات 
القدرة على تقديم فهم مقنع للبيانات: إلا أنهم لا ملكون بالضرورة الاتصالات اللازمة 
لاكتساب التأييد الجماهيري والتأثير على النقاش, أو الحنكة السياسية بمقابل خصم جيد 
التجهيز والدهاء. ومن ثم» فإن الدمموقراطية المحتملة للبيانات المفتوحة مفرطة ف التفاؤلء 
إذا أخذ بالحسبان معظم المستخدمين الذين لديهم درجة عالية من المعرفة التقنية وملف 
تعريفي سياسي قائم )2011 (McClean‏ فالواقع أنه يمكن للبيانات المفتوحة أن تعمل على 
زيادة تمكين السلطة وإعادة ly L5]‏ وتعميق اختلال توازن القوى )2011 .(Gurstein‏ ومن 
الأمثلة التي يستشهد كثيرا بها على هذا الأخير هو رقمنة سجلات الأراضي في ولاية كارناتاكا 
(Karnataka)‏ الهندء حيث عمل مشروع البيانات المفتوحة. والذي تم الترويج له باعتباره 
مبادرة لصالح الفقراء» على حرمان الفقراء من خلال تمكين ذوي اموارد امالية والمهارات من 
الوصول إلى البيانات التي سبق حجبها وإعادة اقتطاع أراضيهم بوضع اليد بغية الاستيلاء 
.(Gurstein 2011; Slee 2012; Donovan 2012) le‏ لقد سهلت السانات ال مفتوحة 
في هذه الحالة: وبعيدا عن العمل على مساعدة كل المواطنينء على التغيير في حقوق ملكية 
الأرض ونقل الثروة من الفقراء إلى الأغنياء. وبعبارة أخرىء فإن فتح البيانات لا يعني عملية 
متأصلة ف الدممقراطية وتعزيزهاء بل إن الواقع أنه يمكن OLLU‏ المفتوحة أن تعمل أداة 
للسلطة التأدسية )2013 (Johnson‏ 

ومن المهم هنا أن التنبّه إلى أن إنتاج البيانات الحكومية يكون لأغراض الحوكمة, 
وهي تتألف من نوعين رئيسيين: الأنشطة المتعلقة بأنشطة الدولة والأنشطة المتعلقة 
بالمواطنينء والأماكن: والأعمال. فالنوع الأول يهتم بكيفية عمل الدولةء وعند إتاحة هذه 
البيانات بشفافية» مكن استخدامها لتقييم الأداء والمساءلة. وقد يقف قلة ضد جعل 
مثل هذه البيانات متاحة للجمهورء على الرغم من الحاجة لتقدير مثل سياسات ال مكاشفة 
هذه خاصة إذا كانت التدابير المستخدمة ذات تأثير مشؤه لتقديم الخدمة وتعمل على 
التلاعب ببيانات التقييم (بالتوافق مع قانون كامبل -Campbells Law-‏ انظر الفصل 
السابع)ء وهذا يؤثر بدوره سلبا في ماهية الخدمات المقدمة وجعل الحياة سيئة لأولئك 
الأشخاص الذين يتلقون الخدمة. ويتكون النوع الثاني من السجلات الشخصية وال مؤسسية 
الحساسة للغايةء وم يتم إنشاؤها بهدف مشاركتها وتبادلها مع الاخرين. وف الواقع. 
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يتوقع المواطنون لها أن تكون محمية بموجب قوانين الخصوصية وحماية البيانات. وحتى 
عندما يتم تجريد هذه البيانات من البيانات التي تشير إلى هوية أشخاص معينين أي 
جعلها مجهولة (Anonymised)‏ وعرضها مجملة: فإنه مكن للبيانات أن تكون على 
درجة من الحساسية والسياسية بصورة كبيرة. فخذء على سبل JLI‏ بيانات الرعاية 
الاجتماعية والصحية ال منقحة bad‏ وامجمعة في وحدات مكانية (Ae)‏ سبيل «JUL‏ مستوى 
الحى)ء فهذه البيانات تمثل أداة لتوجبه التدخلات ال موجهة الرامىة إلى معالجة امعوقات 
الاجتماعيةء كما أن لها إسهامات مفيدة في تحليل البيانات التى تسعي اجتماعيا إلى فرز 
المواطنين والتعريف عنهم فيما يتعلق بالقروض الائتمانية والتأمين ضد المخاطرء ويمكن من 
ثم استخدامها لإنشاء ملفات تعريف مناطقية والتي توصم موضعا ما lods‏ من الاستثمار 
فيه ^" الفصل العاشر). وبعبارة 5,21« مكن إعادة توظيف السانات لأغراض مختلفة 
بطرق شتى (uds‏ لها مخرجات متباينة» وهناك أسباب مشروعة لتوخي الحذر فيما يتعلق 
ما يتم الإفراج عنه من البيانات الحكومية ومقاومة شعار التبسيط ال مستخدم من قبل بعض 
المدافعين عن البيانات المفتوحة "إنها بياناتناء لقد دفعنا مقابلهاء وينبغي أن يكون UJ‏ حق 
الوصول إليها . 


الاستدامة والفائدة وسهولة الاستخدام: 

تركز الاهتمام بشكل كبير» حتى «MI‏ على جانب توفير الوصول إلى البيانات وإنشاء 
مبادرات البيانات اممفتوحة» وكان هناك عدم إيلاء اهتمام كاف لاستدامة المبادرات والكيفية 
التي يتم بها استخدام البيانات وتوظيفها. ففي دراسة أجريت على عدد من مشاريع البيانات 
امفتوحة ال مختلفة أوضحت )2012( Helbig et al.‏ بأن العديد منها تركز بشدة على الناحة 
التقنية الفنية» ويمكن فهم هذه المشاريع على أنها «تزيد قليلا عن المواقع المرتبطة اغات 
سانات degu‏ ودون أي مراعاة لسهولة الاستخدام: وجودة ام محتویء» أو عواقب استخدامها». 
والنتيجة هي مجموعة من مواقع البيانات ا مفتوحة التي تعمل أكثر كحاويات للبيانات 
أو مكبات البيانات» بحيث تفتقر إلى الصفات المتوقعة ف البنية التحتية العاملة للبيانات 
وامنظمة daas TARE‏ مثل البيانات النظيفة: ذات الجودة العالية؛ والتي جرى التحقق من 
صحتهاء وقابليتها للتشغيل المتبادل ها يتوافق مع معايير البيانات ولها التعريف الوصفي 
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ا مناسب ومجموعات تسجيل كاملة (الوثائق ا مرتبطة بها)؛ أي سياسات المحافظة والنسخ 
الاحتياطي والتدقيق؛ وسياسات إعادة الاستخدام والخصوصية والأخلاقيات» والترتيبات الإدارية 
وآليات تنظيم الإدارة والحوكمة؛ والاستقرار JUI‏ وخطة طويلة الأجل للتنمية والاستدامة 
(انظر الفصل الثاني). كما تفتقد العديد من المواقع للآدوات المناسبة وامواد السياقية لدعم 
تحليل البيانات» وعلاوة على ذلك فإن غالب مجموعات البيانات المنشورة تكون صعبة الأخذ 
والاستفادة منهاء حبث تتألف من تلك التي Ja as‏ نشرها وتحتوي على بيانات غير حساسة 
كما أن الذنها 54505 EE EEPE‏ سنا às‏ المقابلء غالبا ما LS‏ البنانات الأكثر صعوبة وتطليا 
لجعلها مفتوحة في حالة مغلقة» بسبب LLAS‏ حساسيتها أو لأنها تتطلب المزيد من العمل 
الإداري للامتثال لقوانين حماية البيانات (2013 (Chignard‏ 

ويتمثل جزء من المشكلة في أن العديد من مواقع البيانات المفتوحة هي استجابة عنيفة 
وجاهزة لظاهرة ناشتة: وقد تم بناؤها من قبل متحمسين ومنظمات ممن لديهم خبرة 
قليلة في أرشفة البيانات أو الاستخدام السياقي للبيانات التي تم فتحها. وقد تم دعمها 
والترويج لها من خلال الملتقيات ايلكثفة مطوری البرمجيات (Hackathons «555585 UJl)‏ 
ومنتديات العطل الأسبوعية مجموعات الاختصاص (Data Dives)‏ التي تعيد طرح 
وإنتاج العديد من هذه القضايا. وكما McKeon (2013) and Porway (2013) asi‏ فإن 
هذه الأحداث والتجمعات التي تدعو المبرمجون والأطراف ال معنية الأخرى لبناء تطبيقات 
ME‏ البيانات المفتوحة لها فائدة محدودة. ففي حين أنها تركز الاهتمام (Ue‏ السانات 
a5‏ وسملة جيدة للتؤاضال: إلا أن alils]‏ الذين 9593s‏ بالترمحة غالا ما يفتقرون إلى 
المعرفة السياقية اممعمَقة قيما يتعلق Ue‏ تشير البيانات a)‏ أو ينتمون إلى مجموعة سكانية 
duso‏ ليست بالضرورة معبرة عن شريحة مجتمعية أوسع نطاقا «JULI Law (Ae)‏ الشباب 
والمتعلمون والتقنيون)ء ويظنّون أن المشاكل الهيكلية العميقة يمكن حلها من خلال الحلول 
التقنية. إنهم «كيان مؤلف من مجتمع صغير من المتطوعين المتحمسينء وليسوا من 
الأشخاص الذين لديهم مصلحة كبيرة في رؤية المشروع ينجح» )2013 .(McKeon‏ وعلاوة 
على 505« لا تزال الحلول التي تم إنشاؤها في هذه اللقاءات على إصدارها الأول» مع قليل 
من المتابعة بعد انتهاء الحدث ودون تحديث أو صيانة أو تطوير لاحق. وكان جواب 
Pi Jal» «UJ Porways (2013)‏ لتغيير مناسب هو الجمع بين أولئك الذين يفهمون 
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البيانات والمشكلات القائمة على أرض الواقع مع أولئك الذين يستطيعون برمجة التطبيقات 
وبنائها والمحافظة عليهاء وقد اقترح )2013( McKeon‏ عقد اجتماعات تخطيطية مسبقة 
وتوصيات توجيهيه بعد الحدث تهدف إلى استدامه ال مخرجات وإنشاء مجتمع على S24‏ 
الطويل. وبعبارة 5,21« هناك حاجة للتوفيق بين الخبرات الموجودة والخبرات في تطوير 
التطبيقات. والحاجة نفسها مطلوبة مع مواقع البيانات المفتوحة. حيث تتطلب تعلم 
الدروس المستفادة من أولئك الذين عملوا لفترة طويلة سابقة ف الأرشفة وقطاع أعمال 
تاذل البيانات: kaata‏ ذلك أفتاء المحفوظات الأرشيفية والعلماء والجغرافيون. 

ونتيجة لهذه القضابا العويصة ال مختلفة: Jus‏ من إنشاء دورة (Virtuous Cycle) dolos!‏ 
بحسب ما تفترض حركة البيانات ال مفتوحة. حيث الإفراج عن المزيد والمزيد من مجموعات 
البيانات» في 2o 5L‏ من JIS LN‏ والصيغ: ينتج die‏ مزيد من الاستخدام: ومن ثم الإفراج عن 
المزيد من البيانات مستقبلاء إلا أن العديد من المواقع, كما لاحظت )2012( Helbig et al.‏ 
cale‏ من انخفاض معدلات التصفح لها وتراجعها لأنها لا تشجع على الاستخدام أو لا تقدم 
التسهيلات للمستخدمين في هذا الخصوصء وتقتصر خدماتها على عوامل أخرى مثل ممارسات 
إدارة البيانات وعرض الجهد المؤسسي المبذول والسياسات الداخلية المعمول بها. فبعد الشرارة 
الأولى من الاهتمام» تراجع استخدام البيانات بشكل ملحوظ للغاية بسبب الكشف عن القيود 
المفروضة على البيانات ومحدوديتها ونضال ا مستخدمين من أجل إيجاد طرق لكيفية استخدام 
وتحليل البيانات بشكل مربح. وقد لاحظ )2011( McClean‏ على سبل JELI‏ أن التحليل 
الناشئ عن اليانات ال مفتوحة كان له تأثير محدود على النقاشات السياسية» وخلص فيما 
يتعلق بنظام المعلومات ال مجمعة على الإنترنت (كوينز (COINS‏ الخاص بالبيانات 4JU‏ 
الحكومية في المملكة المتحدة: إلى أنه بعد 

هبّة قصيرة من اهتمام وسائل الإعلام في منتصف عام 2010 وف أعقاب إطلاقه.... 
فإن التقارير التي تشير صراحة إلى نظام كويْنز غدت الآن نادرة للغاية» كما أن العاملين في 
الصحافة الذين كانوا الأكثر اهتمامًا بالحصول على حق الوصول إليه قد صرّحوا بأنه م تثبت 
فائدته كمحرّك فاعل للصحافة على وجه الخصوص. 
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وحيث يتم نشر البيانات دوريا على سبيل المشال» بصورة فصلية أو سنويةء فإن 
الاستخدام يميل إلى أن يكون دوريا وغالبا مرتبطا مشاريع محددة مثل sti‏ الاستشارية 
بدلا من وجود نمط أكثر DLS‏ من الاستخدام الذي قد يتوقعه المرء لبيانات تتغير بطبيعتها 
آننا بصورة مستمرة أو لديها قيمة اقتصادية عالية. ففي مثل هذه الحالات» لاحظت 
Helbig et al. (2012)‏ أن مجموعة من حلقات ردود الفعل السلسة قد أبطأت توفير 
البيانات واستخدامهاء ومن ثم زيادة خفض الاستخدام. ولذاء فبعد بعض «المكاسب 
السريعة» الأولية» يكمن الخطر في تحؤل أي دورة إيجابية من كونها إيجابية إلى سلبية 
وتقويض الأساس المنطقي لتمويل الحكومة المركزية مثل هذه المبادرات وكونها عرضة 
للتوقف المفاجئ. إن المفتاح لتجنب نشوء مثل هذه الدورة السلبية هو التأكد من 
تركيز أي مبادرة بأكبر قدر ممكن على جانب الطلب كما في جانب العرضء وأنها توفر 
للمستخدمين بيانات قابلة للتشغيل اطتبادل والأدوات التحليلية وغيرها من الخدمات 
التي تسهل استخدام وإضافة قيمة للبيانات: بدلا من مجرد ربط الملفات: 


الخلاصة: 

عند أحد المستويات» تعد قضية البيانات المفتوحة والبيانات المرتبطة بديهية - حيث تسهم 
البيانات المفتوحة في صنع الشفافية والمساءلة وا مشاركة والاختيار والابتكار الاجتماعي والكفاءة 
والإنتاجية وتعزيز الحوكمة والابتكار الاقتصادي وتكوين الثروات. في حين تعمل البيانات ال مرتبطة 
على تحويل ا معلومات الموزعة عبر شبكة الإنترنت إلى شبكة دلالية يمكن من خلالها القراءة الآلية 
للبيانات وربطها معا. وعلية تحمل البيانات المفتوحة والبيانات المرتبطة في طياتها الكثير من 
الوعود والامال والقيمة مع اعتبارها د محفوفة با مخاطرء فواقع الحال بالنسبة للبيانات 
المفتوحة والسانات المرتتطة أكثر 3 TR‏ > كما أن الأسس الاقتصادية لها ليست واضحة على 
الإطلاق. ويبدو أن للبيانات المفتوحة والبيانات المرتبطه تكاليف هامشية قليلة» ولكن الحاجة 
قائمة في عملية إنتاجها والطاقم الفني والجهاز المؤسسي لتسهيل استخدامها والحفاظ عليها مما 
يلزم تكاليف حقيقية من حيث العمالةء واممعدات» واموارد. وق الواقع. فإن البيانات المفتوحة 
بعيدة كل البعد عن كونها مجانيةء ولكن حتى «OVI‏ م يتم وضع نموذج متماسك لتمويل مستدام 
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مبادرات البيانات المفتوحة دون إعانة حكومية. كما أن فوائد البيانات المفتوحة من حيث إنتاج 
قيمة مضافة على فائض الاستهلاك والمشاريع التجارية الجديدة: والمنتجات المبتكرة, والتكاليف 
قد قابلها إيرادات ضريبية إضافية افتراضية إلى حد كبير أو بدأت بالتحقق فقطء وعلاوة على 
«5U5‏ فإن العواقب السلبية المحتملة لفتح البيانات لم تستكشف بعد بالكامل. 

فهناك حاجة إلى الدفع بمزيد من الاهتمام النقدي لكيفية تطور مشاريع البيانات المفتوحة 
كظاهرة duis‏ اجتماعيه مقعدة ومرتبطه بطائفه متنوعة من البرامج. وا معنيين. واصحاب 
المصلحة. وحتى OI‏ تمحورت الجهود حول العمل السياسي والتقني المتعلق بإقامة مشاريع 
البيانات المفتوحة» وم يتم العمل بشكل كاف على دراسة هذه التحركات المادية والتي تلامس 
العديد من الجوانب وعواقبها. ونتيجة لذلكء فإننا نفتقر إلى دراسات الحالة التفصيلية لتطبيق 
مشاريع البيانات المفتوحة. والتجمعات المحيطة بهاء والتي تعمل على صياغتهاء والطرق 
الفوضوية. والطارئة والعلائقية التي تتكشف مرور الوقت. ولن تظهر صورة أكثر اكتمالا 
للبيانات المفتوحة والبيانات المرتبطة إلا من خلال مثل هذه الدراسات التي ستكشف عن كل 
من الإيجابيات والسلبيات لمثل هذه المشاريع وتوفر إجابات عن أسئلة معيارية بشأن الكيفية 
التي ينبغي تنفيذها بها ومعالجة قضايا الاستدامة وسهولة الاستخدام والسياسات المتعلقة بها. 
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البيانات الكسرة (Big Data)‏ 


تتبع )2012( Francis Diebold‏ منشأ استخدام مصطلح «البيانات الكبيرة» إلى منتصف 
التسعينيات )19908( حيث استخدم لأول مرة من قبل جون (John Mashey) $l‏ 
كبير العلماء السابق المتقاعد من شركة سيليكون غرافيكس. للإشارة إلى معالجة وتحليل 
مجموعات البيانات الضخمة. وقد كان المصطلح قليل الجذب ف البداية. ففي العام ٠٠١8‏ 
استخدم عدد قليل m‏ من الناس مصطلح «البيانات الكبيرة»» سواء في المجالات الأكادمية 
أو الصناعية. وبعد خمس سنوات أصبح مصطلح «البيانات الكبيرة» التعبير الطنان الأكثر 
شيوعا في الاستخذام في دوائر الأعمال ووسائل الإعلام الشعبية» مع تعليقات دورية في 
الصحف الأكثر انتشاراء مثل صحيفة النيويورك تامز (New York Times)‏ والفاينانشال 
تامز (Financial Times)‏ ومقاطع وأعداد خاصة في المجلات العامة والمجلات العلمية 
مثل عام الاقتصاد (Economist)‏ والوقت (Time)‏ والطبيعة (Nature)‏ والعلوم 
.(Science)‏ لقد كان هذا الانتشار وزيادة الاستخدام ال مرتبطة به هو ما أذى بالفعل إلى 
إعلان غارتنر (Gartner)‏ فى يناير )2013( عن انتقال تقنية البيانات الكبيرة على طول دورة 
الدعاية LS) (Hype cycle)‏ يطلق عليها نموذج النضج التقني) من مرحلة «ذروة تضخم 
التوقعات» إلى «مستوى خية الأمل» )2013 «(Sicular‏ مع إعلان بعض الدعاة سابقا عن 
موت «البيانات الكبيرة» بصفته ع اانا ذا معنی» حيث c‏ أصبح Leii P P‏ وواسع 
النطاق للغاية في التعريف (على سبل «(de Goes 2013 «JULI‏ فبعض lal‏ الشركات 
التي تبنت المفهوم تصارع من أجل تحويل الاستثمارات في البيانات الكبيرة إلى عوائد ربحية 
والبعض يشككون في فوائدها المحتملة. ومع ذلكء ظل قطاع الأعمال والقطاع الحكومي 
العام وممولو البحوث على قناعتهم بارتفاع منحنى التنوير (Slope of Enlightenment)‏ 
للبيانات الكبيرة مجددا إلى مستوى الإنتاحبة (Plateau of Productivity)‏ عير دورة 
الإعلان أو نموذج النضج التقني» بل وأكثر من ذلك» أنها وجدت لإحداث تغيير جذري في 
كيفية عمل العلوم وإجراء الأعمال )2013 ;Siccular‏ انظر أيضا للفصلين السابع والثامن). 
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Ss‏ نوقش في الفصل الثاني فقد وجدت ولفترة طويلة من الزمن مجموعات ضخمة من 
بيانات عبر الحكومات والصناعات والأوساط الأكاديممية التي تم استخراج ال معلومات منها 
من أجل تقديم مزيد من الرؤى وا معرفة: فالإدارات والوكالات الحكومية أنتجت بشكل 
روتيني كميات ضخمة من البيانات. على سبيل JELI‏ قامت إدارة المحفوظات والسجلات 
الوطنية في الولايات المتحدة في عام Y* W‏ بتخزين ما يقارب 6,0 مليون قدم مكعب من 
الوثائق المادية من وكالات السلطة التنفيذية الأمريكيةء والمحاكم. ومجلس النواب» ومقر 
الرئاسة (وهي خمسة ف المائة من سجلات الحكومة الاتحادية) مما يضيف ثلاثين آلف 
قدم بصورة خطية سنويا )2013 «Ellis‏ بالإضافة إلى خمسمائة تيرابايت من البيانات 
الرقمية. كما تم بالمثل جمع بيانات للشركات عن عملياتهاء والأسواقء والعملاء وقواعد 
بيانات هائلة من البيانات العلمية التي تمّ جمعها ومشاركتها من بداية العلم الحديث. 
لذلك» ما المقصود من مصطلح «البيانات الكبيرة». بالنظر إلى كميات البيانات الناتجة في 
امجالات السابقة؟ 

فكما هو شأن العديد من المصطلحات المستخدمة للإشارة إلى الاستخدام المتسارع في 
التقنبات والممارسات» لا Aog‏ تعريف أكاديمي محدد أو صناعي متفق عليه مصطلح 
البيانات الكبرةء إلا أن الكثير من التعاريف الشائعة تشر إلى الثلاثية المكررة للأحرف 
الابتدائية (3Vs)‏ للخصائص المميزة للبيانات الكبيرة: الحجم (Volume)‏ والسرعة 
(Velocity)‏ والتنوع )2012 (Variety) (Laney 2001; Zikopoulos et al.‏ فالبيانات 
الكبيرة تتميز بأنها: 
٠‏ ضخمة في الحجم» أي تتكوّن من تيرابايت أوبيتابايت من البيانات. 
ه عالية السرعة» أي أنها تنشأ بشكل آني أو $539« أو قريبا من الزمن الحقيقي. 
o‏ مختلفة من حيث تعدد تنوعهاء حيث تتنوع البيانات بين المنظمة وغير المنظمة في 

طبيعتهاء كما تتنوع في الغالب من حيث مرجعيتها الزمانية وا مكانية. 

فخلال زمن ما قبل البيانات الكبيرة. تقيدت قواعد البيانات بين هذه الخصائص الثلاث: 
حيث كان من الممكن لقاع دة البيانات الجمع بين خاصيتين اثنتين في ان واحد (ضخمة 
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السانات الكبيرة 


وسريعة» متنوعة وسريعة» وكبيرة ومتنوعة) )2012 (Croll‏ إلا أنه مع تعزيز قدرة المعالجة 
الحاسوبية» والتصاميم الجديدة OLLI selgi‏ والتخزين الموزع (انظر الفصل الخامس)ء 
أصبح تحقيق الثلاثة مجتمعة في وقت واحد ممكنا مما يتيح أشكلا جديدة للتحليل 
وتقديم عروض مفصلة للغاية للنظم الضخمة والمتغيرة باستمرار. وعدا عن الخصائص 
الثلاث السابقة. أشارت المؤلفات الصادرة مؤخرا إلى عدد من الخصائص الرئيسية الأخرىء 
حيث تتميز النيانات الكبيرة أيضا بالميزات التالية: 


o‏ شاملة في نطاقها. حيث تسعى لتغطية كامل مجتمع أو نظم الدراسة (ن = الجميع)ء أو 
على الأقل توفر حجم obs‏ آکر من تلك التى يجري استخدامها في دراسات البيانات 
التقليدية أو الصغرة. 

٠‏ متناهية في دقتهاء حيث تهدف إلى أن تكون مفصّلة قدر الإمكان» ومفهرسة بشكل فريد 
في تحديد الهوية. 

٠‏ علائقية بطسيعتهاء كونها 3 تحتوى على حقول بيانات مشتركة تمكن من الربط بين 
محموعات سانات مختلفة. 


LLG حيث تحمل سمات التفرع (مكن إضافة حقول بيانات جديدة بسهولة) مع‎ dipa o 

التوسع (يمكن التوسع في حجمها بسرعة). 

boyd and Crawford 2012; Dodge and Kitchin 2005; Marz and Warren) 
.)2012: Mayer- Schonberger and Cukier 2013 

وبالنظر إلى الحملة الدافعة إلى التحويل الرقمي (الرقمنة- (Digitisation‏ للبيانات 
التقليدية الصغيرة والتوسع فيها ضمن البنى التحتية الرقمية التي تتميز بالضخامة والتنوع 
مثل ا محفوظات الأرشيفية dubl‏ التعدادات السكانية: وا مجموعات الثقافية والاجتماعة 
التراثية؛ انظر الفصل الثاني)» فقد كانت السرعة والخصائص الإضافية هي ما ميزت البيانات 
الكيرة وجعلت منها ابتكارا استثنائا )1997 (Christensens‏ وغير بصورة جذرية طبيعة 
البيانات وما مكن عمله من خلالها (انظر الجدول .)7-١‏ فعلى سبيل JU‏ يتميز publ‏ 
الأسري الوطني بكبر الحجم. والدقة المتناهية, وقوة العلائقية:. إلا أنه يفتقر إلى السرعة 
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(تتغير البيانات مرة واحدة في السنة « والتنوع (يتكوّن من ثلاثين سؤالا منظما)» والشمول 
(حيث تقتصر العينة على فرد واحد من عشرين أسرة)ء والمرونة (كون حقول البيانات 
ثابتة ولا تتغير خلال ا مسوحات المتعاقبة للتمكن من تحليل السلاسل الزمنية). ففي هذا 
الفصل تم إيراد الخصائص السبعة للبيانات الكبيرة ويناقش الفصل التالى العوامل المساعدة 
للبيانات الكبيرة ومصادرها. 


:(Volume) الحجم‎ 

شهد العقد الماضي انفجارا في كمية البيانات التي تم إنتاجها ومعالجتها بشكل يومي. 
وكما عنونت مجلة وايرد (Wired)‏ بشكل رئيس في عددها الخاص للعام 2008: نحن ندخل 
sace»‏ التيرابايت» )$5( الواقع» لقد ولجنا بالفعل في عصر الزيتابايت؟ 70٨2‏ بايت). وقد 
سعت العديد من الدراسات لتقدير وتتبّع الأحجام معنية (Ae)‏ سبيل Hilbert and Jbl‏ 
.(López 2009; Gantz and Reinsel 2011; Short et al. 2011‏ واستخدمت هذه 
الدراسات منهجيات وتعاريف مختلفة» ولكنها أجمعت بالكلية على أن معدل نمو البيانات 
كان رهيبا في نطاقه» وعلاوة على «US‏ فهي قائمة على النمو باطراد أكبر في المستقبل 
المنظور. إن أبسط طريقة لتوضيح هذا النمو هو إعطاء بعض الأمثلة على تقديرات d lle‏ 
لأحجام البيانات وبعض التقديرات المتعلقة بكيانات محددة: ولتوفير إطار مرجعى» Lai‏ 
الجدول (£-Y)‏ بصورة مختصرة كيفية قياس حجم البيانات. 

الجدول )1-£( 


na (b) ca‏ هى اختصار لتعبير «الخانة الثنائية» حيث تستخدمه 
الحاسبات لتخزين ومعالجة البيانات على صورة الرمز 
aUJI‏ )0 أو1) 


45U p cob‏ خانات ثنائية | مساحة تخزينية كافية لتمثيل رموز الأبجدية الإنجليزية 
والأرقام باستخدام الرموز الثنائيه 








)8 بت) 
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0 أو210 «ob‏ | من كلمة «الألف» (Thousand)‏ باليونانية. فالصفحة 
الواحد من النص ا مطبوع تقدر بحوالي 2 كيلوبايت 


0 كيبلوبايت؟ 
cob 220‏ 





من كلمة «ضخم» (Large)‏ باليونانية. فكامل أعمال 
شكسبير الأدبية يقدر حجمها ب 5 ميجابايتات في حين 
يقدر حجم الملف الصوت ال موسيقي بحوالي 4 ميجابايت 
من كلمة «هائل» (Giant)‏ باليونانية. ففيلم من ساعتين 
يمكن ضغطه في ملف حجمه 2-1 غيغابايت 


0 مبجابايت؛ 
cob 230‏ 















«cob 1000 | (TB) cubla 


cob 240 


من áalS‏ “عملاق' (Monster)‏ باليونانية. فالكتب 
ا مفهرسة في مكتبة مجلس النواب الأمريكي (الكونغرس) 
يقدر حجمها بحوالي 15 تيرابايت 
بيتابايت (PB)‏ | 1000 تيرابايت؛ 250 | تقدّر بيانات كل الرسائل التي تم توصيلها من قبل خدمة 
البريد الأمريكى في العام 2010 بنحو 5 بيتابايت. 


cab 
gue AUS, CEPR 
.) 116 Economist) cob 0 (EB) 
ص سيم‎ EON. مج و‎ 
cob 270 


بحوالي 1.2 زيتابايت 
يوتابايت (YB)‏ | 1000 زيتابايت؛ حاليا هي قيمة أكبر من التخيّل 
cab 280‏ 


















تم وضع الاختصارات من قبل المنظمة الحكومية الدولية ántergovernmental organization‏ 


وا مكتب الدولي للأوزان والمقاسيس International Bureau of Weights and Measures‏ تم 
إضافة وحدق يوتابايت وزيتابايت في العام 1991؛ المصطلحات للكميات الأكبر لم يتم وضعها بعد. 





المصدر: مجلة عام الاقتصاد )2010( (The Economist)‏ تم إعادة إنتاجها بإذن عام الاقتصاد. صحيفة عام 
الاقتصاد المحدودة: لندنء الإصدار 11 مارس 2014. 

وقد بين )2012( Zikopoulos et al.‏ أنه في العام ١٠٠٠م‏ تم 02359 ۰ Cobb‏ 
من البيانات ف العالم. وبحسب التقرير السنوي -Short et al. (2011: 7) J‏ كم e$‏ 
امعلومات؟ - عالجت خادمات العام للعام aY- A‏ 9.57 زيتابايت من ال معلومات... وكان 
هذا معدل W‏ غيغابايت من المعلومات يوميا للعامل العادي» أو نحو Y‏ تيرابايتات من 
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المعلومات dd‏ عامل سيدا وقامت الشركات ف العام معالحة Y‏ ترانانتا من المعلومات 
lisa‏ باستثناء المصادر غير المحوسبة: وبحلول عام «e ۲٠٠١‏ قدرت مؤسسة el‏ جي اي 
(MGI)‏ (بحسب ما ذكر 3 :2011 oL (Manyika et al.‏ الشركات عالميا قد قامت O2 3ÀX‏ 
اكثر من V‏ إكسابايت من البيانات الجديدة على الأقراص الصلبة ... في حين قام المستهلكون 
بتخزين أكثر من 1 إكسابايتات من البيانات الجديدة على أجهزة من قبيل أجهزة الحاسب 
الشخصية وأجهزة الحاسب ال محمولة. كما قذروا كذلك أنه في «e ۲۰۰۹ ele»‏ كان ما يقرب 
من كل القطاعات ف الاقتصاد الأمريك لا يقل بياناتها المخرّنة بالمتوسط عن ٠٠١‏ تيرابايت 
من COLI‏ لكل شركة فيها أكثر من آلف موظف. كما امتلكت العديد من القطاعات أكثر 
من 1 ستابايت من السسانات المخزنة لكل شركة». وق عام e Y*W‏ أشار Neelie Kroes‏ 
مفوّض الاتحاذ الأوروبي لجدول الأعمال الرقميء بأن VV‏ مليون بليون cab‏ من البيانات 
يجري توليدها في الدقيقة الواحدة على مستوى العام (2013 (Rial‏ 


وبناء على مراجعة )2011( Manyika et al.‏ لنمو حجم البيانات» فقد توقعوا 
ارتفاعا بنسبة 5٠‏ قي Ul‏ في نمو البيانات التي يتم « إنشاؤها على مستوى العام baia‏ 
وقدر )2011( daS» ob Gantz and Reinsel‏ المعلومات التي تم م إنشاؤها واعادة 
نسخها )$5 (Us),‏ على الإنترنت ستتجاوز VA‏ زيتابايت 5s4b 5 A)‏ غيغابايت) في 
العام ٠١١١‏ مخزنة في ٠٠١‏ كوادريليون (مليون مليار) ملف بيانات». ويبين هذا الذي 
ذكروه "m‏ مقدار تسعة أضعاف خلال خمس سنوات فقطء مع نمو متوقع ف ذات 
الوقت إلى أكثر من الضعف كل سنتين. ونتيجة UI‏ فقد توقعوا في تقريرهم بأنه في 
العقد التالي: 

سيزداد عدد الخوادم (الافتراضية والفيزيائيه) في جميع أنحاء العام بعشرة أضعاف»› 
في حين ستزداد كمية المعلومات المدارة في مراكز بيانات الشركات بمقدار خمسين ضعفاء 
وسيزداد أعداد الملفات التي سوف تضطر مراكز البيانات إلى التعامل معها بمقدار 75 ضعفاء 
على الأقل. 

IBM (2012) elu هذا النمو الهائل ف إنتاج البيانات» ادعت شركة اي‎ dieg 
من البيانات في العام اليوم قد تم إنشاؤها في العاميين الماضيين فقط»‎ Z3» oLo 
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كما توقع )2012( Zikopoulos et al.‏ أن تقارب أحجام السانات Yo à»‏ زيتابايت 
بحلول عام ۲۰۲۰م. 

ويمكننا إدراك وقوع هذا الانفجار في إنتاج البيانات الرقمية من خلال النظر في بعض 
الأمثلة المحددة. فشركة تك أمريكا (TechAmerica)‏ قدرت ab‏ يجري 5 ارسال ما 
يقرب من 114 ملبار رسالة بريد الكترونية و٤۲‏ مليار رسالة نصيةء كما e‏ اجراء W‏ مليار 
مكامة هاتفية على مستوى العاط )2013 (Strohm and Homan‏ ووفقا لشركة سيسكو 
(CISCO)‏ ففي العام e Y«W‏ كان هنالك تقريبا ما يناهز ٠١‏ مليارات عنضر (أجهزة اتصال 
ومستشعرات) مشكلة شبكة إنترنت الأشياء (Internet of Things -IoT)‏ والتى يقوم كل 
منها بإنتاج كميات متغيرة من البيانات» مع الزيادة المتوقعة لهذا الرقم ليفوق الخمسين 
Jalos bids‏ عام 0م )2013 .(Farber‏ أما ما يتعلق بحركة الاتصال على الإنترنت» 
وقد CL‏ 5 شركة جوجل تعالج Y‏ مليارات طلب استعلام للبحث يومياء وتقوم بتخزينها 
(Mayer-Schonberger and Cukier 2013) IM‏ وقرابة ۲١‏ ستابابت من السانات 
كل يوم )2012 às (Davenport et al.‏ العام «e ۲١١١‏ قضى المستخدمون النشطون 
مموقع التواصل الاجتماعي فيسبوك أكثر من ٩,۳‏ مليارات ساعة خلال شهر Manyika et)‏ 
(al. 2011‏ وبحلول عام ۲۰۱۲ ie‏ ذكرت الشركة بأنها كانت تعالج Y,O‏ مليار من مختلف 
أنواع بيانات ال ملحتوى (وصلات. مخازن» صورء أخبار وما إلى ذلك). Y, Vs‏ مار من ردود 
الإعجاب وتلاقمائه مليون dulas‏ تحميل للصور .(Constine 2012) Lodi‏ كما تم إنتاج 
]52.28 أربعمائة ملبون تغريدة nid‏ في العام ٠ e Y * W‏ معدل زيادة مقداره متتان 
في sia GUI‏ مع احتواء JS‏ تغريدة على تلاثة وثلاثين T‏ من السانات الوصفية 
لها )2013 ASI Ai-je .(Mayer-Schonberger and Cukier‏ من هذه البيانات غير 
منظمة بطبيعتها. وبامثل هنالك انفجار في حجم إنتاج البيانات المنظمة قد وقع Ae La‏ 
سبيل JE‏ وفيما يتعلق ببيانات تجارة التجزئة الخاصة بالأوراق المالية والمبيعات: والتي تم 
جمعها من خلال السلاسل السوقية (اللوجستية) ومنافذ البيع» أنتجت سلسلة متاجر وول 
مارت (Walmart)‏ أكثر من Y,o‏ ستابايت من السانات المتعلقة بأكثر من مليون عملية خاصة 
بالعملاء في كل ساعة ف العام aY- NY‏ «أي يفوق ما يعادل VIV‏ مرة من المعلومات الواردة 
في جميع الكتب ال مصنفة في مكتبة الكونغرس»؛ 6 :2012 (Open Data Center Alliance‏ 
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كما أنتجت متاجر تسكو (Tesco)‏ البريطانية أكثر من ١,0‏ مليار lads lia‏ من بنود السانات 
كل شهر فى العام ٠١١١‏ م )2011 (Manyika et al.‏ 


وبا مثلء تنتج الحكومات coL alls‏ العامة كميات هائلة من البيانات حول مواطنيها 
والدول الأخرى. على سبيل «JL‏ بدأت cols‏ التنقل والعبور في مراقبة التدفق المستمر 
للناس من خلال أنظمة النقل» على سبيل «JUL‏ جمع زمن ومكان استخدام بطاقات السفر 
مسبقة الدفع مثل بطاقة أويستر في لندن. كما يجري الآن تقديم العديد من نماذج وطرق دفع 
الضرائب أو طلبات الحصول على الخدمات الحكومية من خلال الانترنت» ففي العام 82009« 
أنتجت حكومة الولايات المتحدة AEA‏ ستابايت من السانات (مؤسسة التقنية LS yoYI‏ 
.(TechAmerica Foundation 2012‏ كما تعمل وكالات الاستخبارات الست عشرة التي 
تشكل أمن الولايات Basal‏ جنبا إلى جنب مع فروع الجيش الأمريكيء على مراقبة وتخزين 
وتحليل كميات هائلة من البيانات كل ساعة. من خلال آلاف المحللين العاملين في تدقيق 
وتفسير النتائج. وللحصول على فكرة عن حجم بعض مشاريع الاستخبارات العسكرية؛ فإن 
مشروع النظام المستقل للمراقبة الأرضية الصورية الحقيقية (ARGUS-IS)‏ والذي كشفت 
عنه وكالة مشاريع البحوث المتطورة الدفاعية (داربا (DARPA‏ وجيش الولايات المتحدة في 
العام ٠١١1‏ م» هو منصة للمراقبة بالفيديو بدقة ١,8‏ غيغابايت والتي يمكنها بيان التفاصيل 
الصغيرة حتى ست بوصات من ارتفاع ٠٠٠٠١‏ قدم diw)‏ كيلومترات) )2013 (Anthony‏ 
paa‏ تا ۸ مليار بكسلء في ۱۲ إطارا في الثانية ( لقطة في الثانية )» مما ينتج ما يقارب 

٠‏ غيغابت ف الثانية. liag‏ يعادل نحو 1 بيتابايتات من البيانات يوميا. وباستخدام 
الحاسوب العملاق: مكن للنظام إجراء التحليل آنيا من خلال تتبّع ما يصل إلى 10 جسما 
متحركا ضمن مجال الرؤية. وهذا هو مشروع واحد فقط في ترسانة ال مشاريع الاستخباراتية 
Abu ll‏ وذات الصلة. 

وبا مثل» فيما يتعلق بالمشاريع العلميةء يتكوّن تسلسل الجينوم البشري من نحو ٠٠١‏ 
غيغابايبت من السانات )2012 :(Vanacek‏ وهذا يتضاعف عر الآلاف من الأفراد مما 
يوسع قاعدة البيانات قريبا إلى تيرابايت وبيتابايت من البيانات. وعندما بدأ التشغيل 
في مسح سلوان الجوي الرقمي (Sloan Digital Sky Survey)‏ في العام 5٠٠١‏ أنتج 
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المرقاب (التلسكوب) في نيومكسيكو من بيانات الرصد والمراقبة في Jal‏ شهرين أكثر مما 
سبق جمعه فى تاريخ ele‏ الفلك حتى ذلك الوقت )2010 (Cukier‏ وق عام e ٠٠٠١‏ 
بلغ حجم أرشيفها ما يقارب ١١‏ تيرابايت من البيانات» وهي كمية سيتم قريبا جمعها 
كل خمسة أيام من قبل المرقاب الكبير للمسح الشامل Large Synoptic Survey)‏ 
ioc slg (Telescope‏ العمل به قي شيلى $ العام 2016 Slo .(Cukier 2010)e‏ 
ضخامة من aolas dis‏ هادرون الكبير (Large Hadron Collider)‏ والذي g 3b es»‏ 
٠‏ تيرابايت من البيانات ق الثانية الواحدة )2010 (The Economist,‏ وق dis‏ 
وغيره من الحالات» يتم إنشاء بيانات هائلة للغاية لا مكن تحليلها أو تخزينهاء بحيث 
تعد بيانات عابرة. وق الواقع» لا وجود لهذه القدرة التخزينية لكل هذه OLLI‏ فعلى 
الرغم من التؤسع السريع في القدرات التخزينية» إلا أن هذا التوسع لا يمكنه مواكبة إنتاج 
السانات )2011 .(Gantz et al. 2007; Manyika et al.‏ 


الشمول :(Exhaustivity)‏ 
تستخدم عملية انتقاء العينات في دراسات البيانات الصغيرة من أجل إنتاج مجموعة 
بيانية تمثيلية لمجتمع الدراسة من جميع البيانات ا محتملة في وقت معين ومكان معين. 
وتستخدم عملية انتقاء العينات من مجتمع الدراسة بسبب كبر هذا ا لمجتمع وتعذر جمع 
كافة البيانات المتعلقة به لمحدودية الوقت واطوارد ا مخصصة. ف اممقابل» تسعى مشاريع 
البيانات الكبيرة إلى التقاط بيانات كامل مجتمع الدراسة (ن = (SUI‏ أو على الأقل» حجم 
غمنة jS‏ من امعتادة في دراسات البيانات الصغيرة Mayer-Schonberger and Cukier)‏ 
3. فمن ناحيةء تعد هذه البيانات نتاجا ثانويا للتقنيات التي استخدمت في إنتاج 
البيانات» جنبا إلى جنب مع النمو الهائل في القدرة على تخزين البيانات (انظر الفصل 
الخامس)» ومن ناحية أخرىء هناك قناعة بأن "الأكثر هو أفضل" وسيقدم تمثيلا أكبر ومزيدا 

من الدقة والصحه ق التحليل. 

وق النظم امفتوحة Jis‏ المشاريع العلمية الكبيرة. كتلك التى تقس السانات AU‏ 
للإبلاغ عن الطقس ونمذجة الأرصاد الجويةء أو جمع البيانات الفلكية باستخدام مرقاب 
قوي» يكون التوجه نحو مجموعات بيانات أكبر بكثير. مع زيادة أحجام العينات عبر العديد 
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من المتغيرات ما أمكن ذلك. ولا يعني ذلك في ele‏ الفلك: على سبيل المثال» مجرد جمع 
بيانات الضوء؛ ولكن أيضا البيانات من مختلف ألوان الطيف الكهرومغناطيسي: وبدقة 
عالية لأكبر قدر ممكن. أما في حالة النظم المغلقة. مثل الفيسبوك أو شراء السلع من 
متجر على شبكة الإنترنت مثل أمازون أو إرسال رسائل البريد الإلكتروني: فمن ال ممكن 
تسحجيل كافة التفاعلات والعمليات التي تحدث» بالإضافة إلى مستوى عدم التفاعل. وق 
هذه الحالات» هذا هو الواقع بطبيعة Jll‏ فموقع التواصل الاجتماعي الفيسبوك يقوم 
بتسجيل كل نشرء أو تسجيل لإعجاب» أو رفع لصورة يتم تحميلهاء أو وصلة إلى موقع آخرء 
أو رسالة مباشرةء أو لعبة acus)‏ أو فترات الغياب» وما إلى ذلك لكل مستخدميه الذين 
ناهزوا المليار أو نحو ذلك. وبالمثلء لا تسجّل شركة الأمازون فقط تفاصيل كل عملية شراء 
والمشترين»:ولكن أيضا جميع الروابط التي 3 زيارتها وكل السلع :التي تمٌ:استعراضها من 
خلال موقعهاء بالإضافة إلى كافة البنود التي تم وضعها في سلة التسوق وم يتم شراؤها. 
كما يتم تسجيل كافة رسائل البريد الإلكتروني من قبل الخادمات التي تستضيف صندوق 
البريد الإلكتروني للعميل» وتخزين كامل البريد الإلكتروني وجميع البيانات الوصفية ال مرتبطة 
به على سبيل JULI‏ الذين تم إرسال البريد الإلكتروني لهم أو استلامه منهم» والوقت / 
التاريخ» والموضوع. وا ملفات المرفقة. وحتى لو تمّ تحميل البريد الإلكتروني محلياً على جهاز 
المستخدم وتم حذفه فما زالت نسخة محفوظة منه على الخادم» هذا مع احتفاظ معظم 
المؤسسات والشركات بهذه السانات لعدد من السنوات. 

وبالمثل بالنسبة للأشكال الأخرى من البيانات» فقد نمت البيانات المكانية بشكل كبير في 
السنوات الآخيرةء وذلك من خلال الاستشعار الآني عن بعد والصور الراداريةء إلى ا مشاريع 
الكبيرة مكتظة المصادر مثل مشروع خرائط الشوارع المفتوحة (OpenStreetMap)‏ 
وا مسارات اطمكانية الرقمية التي تم إنشاؤها بواسطة مستقبلات أنظمة تحديد المواقع 
dual d. il sod‏ ذاغل الأحيرة: olàzall casos‏ الأؤلان إل Uso o‏ امل مكانناء 
بحيث تجمع التضاريس للكوكب الأرضي بأسره» ورسم خرائط البنية التحتية لدول بأكملها 
وتوفير مجموعات بيانات مشتركة ومرخصة للخرائط. في حين يوفر المشروع الثالث القدرة 
على تتبّع وتعقب الحركة عبر الفضاء بمرور الوقت؛ وبناء مسارات الزمن - الفضاء التى يمكن 
تجميعها لتوفير نماذج الزمن - الفضاء للسلوك عبر مدن ومناطق بأكملها. وتمكن مجتمعة 
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من النمذجة ال مفصّلة للأماكن وطرق التنقلء والمقارنة المسحية عبر الفضاء واستهداف 
التسويق لمجتمعات معينةء وتقديم خدمات جديدة معتمدة على الموقع: والبيانات التي 
مكن الجمع بينها لاشتراكها في المرجعيات الطكانية لإنشاء قواعد بيانات وتطبيقات جديدة 
يمكن البحث مكانيا فيها (على سبيل «JEN‏ جمع البيانات حول منطقة لإنشاء ملفات 
تعريف للحي). 

وبالنظر إلى التقدم الحاصل في سعات التخزين (انظر الفصل الخامس). يبدو أننا قد وصلنا 
إلى مرحلة بحيث يكون من الأسهل في كثير من الحالات تسجيل كل شيء. دون الحاجة إلى فرز 
البيانات» وتدقيقهاء وأخذ عينات منهاء وتسجيل ما يحتمل أنه مفيد منها فقط (ومن الذي 
يعرف ما يثبت احتمال أنه مفيد ف المستقبل؟). وكما أشار )2012( y» :Zikopoulos et al.‏ 
عجب أننا نغرق في البيانات» فإذا كنا نستطيع تتبع وتسجيل شيء ماء فإننا بالعادة نفعل». 
وفي الواقع» أشار )7 :2012( Dumbill‏ إلى أن المبداً الأساسي خلف البيانات الكبيرة هو «عندما 
daz as‏ احتفظ بكل شيء».. ويتجلى هذا بالاعتقاذ بأنه كلما كان المزيد من البيانات lola‏ 
سنحت فرص أفضل لصنع رؤية أكثر صحة ونفاذا... وفرص العثور على «المنتجين» لنظرية 
جديدة John Seely Brown)‏ مقتبس من 8 :2010 Bollier‏ ). وعلى الرغم من ذلك. تسهم 
إستراتيجية السعي نحو الشمولية بشكل كبير في طوفان البيانات» ويتمثل التحدي الأكبر في 
رؤية hal‏ الشامل والصورة الكبيرة من جملة التفاصيل وتمييز الغث من السمينء وإثارة 
مجموعة من الأسئلة الأخلاقية فيما يتعلق بنطاق البيانات التي يتم إنتاجها والاحتفاظ بها 
والاستخدامات التي يجري توظيفها فيها أو من الممكن توظيفها فيها (انظر الفصل العاشر). كما 
أنها تثير تساؤلات معرفية أساسية )2012 (Floridi‏ على سبيل JELI‏ وبالنظر إلى شموليتهاء 
تساءل )2012( Callebaut‏ عما إذا كانت تحليلات البيانات الكبيرة هى علم ما بعد الاختزال 
«(Post-reductivist)‏ وسيتم مناقشة هذه الأسئلة مزيد من التفصيل في الفصل الثامن. 


الدقة والتبويب/ الفهرسة (Resolution and Indexicality)‏ : 
بالإضافة إلى شمولية البيانات» أصبحت البيانات الكبيرة 351 تناهيا في الدقة بكثير, 
وهاتان الخاصيتان يدفعان جميعاً في الاتجاه نحو التبويب/ الفهرسة القوية (عنونة 
بوسم مميز وتحديد للهوية) )2005 (Dodge and Kitchin‏ وتعد صور الاستشعار 
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عن يُعد مثالاً على تعزيز الدقة, ففي أواخر الثمانينيات» كانت أعلى دقة للصور المتاحة 
لمعظم الباحثين غير الحكوميين عن سطح الأرض هي لتلك الصور التي التقطتها أقمار 
لاندسات (Landsat Satellites)‏ الصناعية. حيث تمثل كل نقطة digó‏ (بكسل) قطعه 
هبن الأرض da Y * x Y* J1135‏ في حين أن الكثير من الصور المتاحة على جوجل إيرث 
ذات 35 4 تصل إلى 75,6 × Y,O‏ مترء مما يتيح عرض 5l‏ 25 من التفاصيل وتحليلها. 
وبا لمثلء فيما يتعلق بمخرجات بيانات التعداد السكاني. فقد زاد علو درجة البيانات 
في العديد من الدول. ففي الحالة الأيرلندية» كان نشر بيانات التعداد حتى وقت 
قريب للدوائر الانتخابية ) ۲,٤٠١‏ منطقة متوسط ١٠,٠٠١‏ نسمة في كل منهاء حيث 
كانت الكثافة السكانية لكل دائرة انتخابية أعلى بكثير ف dabl‏ والبلدات وأقل في 
المناطق الريفية). وف العام ٠۲١٠١‏ تم وضع بيانات التعداد بتوزيع جغرافي جديد سمي 
بالتجمعات الصغرةء التى بلغ عددها NAEM‏ تمثل الوحدات الجديدة بالعادة بيانات من 
١0١0 - ٠‏ من الأسر )2009 .(Gleeson et al.‏ وقد أتاحت التجمعات الصغيرة إجراء تحليل 
التعداد (Ae‏ مستوى الحي أو الشارع» بدلا من مساحات شامتتعة dus‏ ومناطق ذات 
أعداد متساوية "T.‏ من السكان التي مكن مقارنتهاء مما ET‏ فهما «SÍ‏ للتجمعات 
السكانية والاقتصاد الأيرلندي. TEMP‏ ق تحري المزيد من الدقهء يجمع العديد من 
وكلاء / سماسرة البيانات كميات كبيرة من البيانات المتعلقة بالأفراد والأسر التى تمكن 
الشركات من استهدافهم بشكل فردي بالسلع والخدمات (انظر الفصل الثاني). 
وقد صاحبت الزيادة في دقه البيانات» الزيادة في تحديد الهويات للأشخاص. وال منتجات». 
«DX sls ls‏ والأقاليم بحيث أصحت باناتها أكثر TE‏ وفهرسة بطريعتها (انظر الفصل 
الخامس). فعلى سبيل «JULI‏ تحمل معظم السلع ال معروضة للبيع في متاجر التجزئة الكبرى 
في الوقت الحاضر الرمز الشريطي (الباركود)» pce‏ هذا الرمز المنتج» ولكن ليس كل وحدة 
منه على حدة - حبث تشترك كل زجاجات صابون شعر الرأس (الشامىو) من نفس العلامة 
التجارية (الماركة) في نفس الرمز - مما يعني أنه لا يمكن التمييز بينها بشكل فردي. 
وفي «oll‏ تتميز زجاجة صابون شعر الرأس الموسومة بشريحة تحديد الهوية باستخدام 
موجات (Radio Frequency Identification Device- RFID) =l!‏ بشكل J‏ 
OS‏ لكل شريحة رمز فريد من الممكن قراءته عن بعد بواسطة جهاز استشعار الذبذبات 
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الراديوي. ونتيجة لذلك» يمكن تتبع كل زجاجة من مكان صنعها من خلال سلسلة التوريد 
وحتى المتجر وسلة العميل» مما يوجد مسار للتدقيق المفصل. وبعبارة 9,2« فقد أصبح 
من الممكن تتبّع الأمور الفردية بدقة عبر الزمان والمكانء Le‏ في ذلك أولئك الذين يعملون 
على نقل أشياء من مكان لآخر. وبالمثلء بالنسبة للمعلومات» وخاصة تلك التي في شكل 
رقميء حيث يتم تعريفها بشكل فريد من خلال رموز إدارة الحقوق الرقمية Digital)‏ 
(Rights Management‏ فعلى سبيل «JUL‏ جمكن تعيين معرفات الكائن الرقمي Digital)‏ 
(Object Identifiers- 5‏ إلى الأعمال الإبداعية المتوفرة على الإنترنت (كالتقارير 
«Xa‏ الصورء الصوت» وملفات الفيديو)ء فمعرفات الكائن الرقمي هي محدد هوية دائم 
مرتبط بالبيانات diogi‏ مثل عنوان الإنترنت (Universal Resource Locator- URL)‏ 
الذي يشير إلى موقع ال ملف. ويعزز استخداه ال معرّفات الفريدة العلائقية والقدرة على ربط 
وضم البيانات معاء كما يوفر وسائل عملية لفرز ورصد ومطابقة وتمثيل الكائنات Lyon)‏ 
:2003a; Dodge and Kitchin 2005; Graham 2005‏ انظر Laf‏ الفصل العاشر ). 


:(Relationality) 45M Jl 
تتمثل العلائقية مدى القدرة على ضم مجموعات بيانات مختلفة بروابط بعضها مع‎ 
بعض وكيف ممكن اسستخدام هذه الروابط للإجابة عن أسئلة جديدة. فالعلائقية هي‎ 
في صميم قواعد البيانات العلائقية (انظر الفصلين الثاني والخامس)ء وهى القدرة على‎ 
إنشاء بيانات غاية في العلائقية التى تدفع بسوق البيانات الواسع وأرباح وكلاء البيانات‎ 
وشركات اطلفات التعريفية (انظر الفصل الثاني). إن الدرجه العاليه من العلائقيه هى‎ 
وكيف تتغير عر‎ dol جدا لفهم التركيبة السكانية لأى‎ is da السكاني‎ alas! ما يجعل‎ 
الزمان والمكان. وتختلف دراسات البيانات الصغيرة فى مدى علائقيتهاء أي ميل تلك التي‎ 
من الترابط من تلك البيانات غير المنظمة.‎ uel تنطوي على البيانات المنظمة لدرجات‎ 
وهذا يستدعي القول إنه ينبغي وجود شكل من أشكال العلائقية بين البيانات لاستخلاص‎ 

التفسيرات والاستنتاجات الشاملة منها. 
وعلى الرغم من أن البيانات الكبيرة لا تستخدم غالبا بنية قاعدة بيانات علائقية 
(انظر الفصل الخامس). فإن ميزة أساسية في طبيعتها هي العلائقية القوية. وكما Ja‏ 
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boyd and Crawford (2011: 2)‏ فإن «البيانات الكبيرة مترابطة بشكل أساسيء وتنبع 
قيمتها من الأنماط التي يمكن استخلاصها من خلال صنع روابط بين أجزاء من «LI‏ 
عن فرد» أو أفراد على علاقة بآخرينء أو مجموعات من الناس» أو ببساطة عن هيكل 
تنظيم المعلومات نفسها». إلا أنها وخلافا لقواعد البيانات العلائقيةء فهي تتقن بالتساوي 
التعامل مع البيانات غير الرقمية (الرمزية)ء والبيانات غير المنظمة كما البيانات المنظمة: 
والربط بين النوعن PE‏ وتعظيم القيمة المستفادة من التقاطعات بينها. ومن 9« أصبح 
من الممكن الربط بين مجموعات degi‏ من البيانات - الشخصيه» والعملية»ء e lis‏ 
والاجتماعية: والمالية: واطكانية» والزمنية: ...إلخ - وتحليلها على أساس فردي وجماعي 
للعلاقات والأنماط. 

وقد ثبت جلياء كمثال على قوة هذه العلائقيةء الاستخدام المكثف للبيانات الكبيرة في 
الحملات الانتخابية للرئيس الأمريكي أوباما في العام ۲۰۰۸م .eY «YS‏ فعلى النحو الذي 
فصّله )2012( dssenberg‏ سعى فريق أوباما لتحديد وتتبع جميع جوانب حملاتهم 
الانتخابية في ٠٠١8‏ م و١٠١۲ «e‏ ووضع سلسلة كاملة من المقاييس التي تم تسجيلها 
والتنقيب فيها بشكل مستمر للحصول على معلومات» وأنماط واتجاهات مفيدة. واشتمل 
ذلك على مراقبة صارمة للإجراءات الخاصة بهمء مثل وضع الإعلانات عبر وسائل الإعلام 
المختلفةء وإجراء حملات بريد الإلكترونية» والاتصال الهاتفي بالناخبين اممحتملين» وطرق 
الأبواب وفرز الاصوات الانتخابية للمناطق» وتنظيم الاجتماعات وا مسيرات» وتتبع الذين 
كانوا قد تحدثوا إليهم وماذا قالوا أو ما التزموا به. وقد عززوا هذه ا معلومات Olis‏ 
التجارب العشوائية واسعة النطاق المصمّمة لاختبار فعالية مختلف طرق إقناع الناس على 
التصويت لصالح أوباما أو التبرع بالأموال لحملته. وجمع فريق أوباما بين جميع ا معلومات 
التي نتجت فيما تعلق بالناخبين وبيانات التسجيلء والتعداد السكانيء والبيانات الحكومية 
الآأخرى.ء ومسوحات الاقتراع» وبيانات جرى شراؤها من طيف واسع من الموردينء ما في 
ذلك وسطاء البيانات ووكالات التصنيف الائتماني» وشركات التلفاز الخطي (Cable TV)‏ 
وكانت النتيجة مجموعة من قواعد البيانات الضخمة عن كل الناخبين في البلاد تتكون مما 
لايقل عن ثمانين من المتغيرات )2012 (Crovitz‏ وأكثر من ذلك» أنها ترتبط بالخصائص 
الدهوغرافية للناخبين المحتملينء وتاريخ انتخابهم» وكل حالة من حالات تواصلهم مع 
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حملة أوباما وردود آفعالهم» والتاريخ الاجتماعي والاقتصاديء وأنماط سلوكهم واستهلاكهم 
ووجهات النظر والآراء التى تم الإعراب عنهاء مع تحديث قواعد البيانات يومياً خلال 
الحملة بكل بيانات جديدة يجري إنتاجها أو شراؤها. إما في الحالات التي لا يعرف فيها 
محللو أوباما الانتماء السياسي للناخب» ولا يمكنهم فيها الوصول إلى ذلك من خلال الاتصال 
المباشر معه» فإنهم يوظفون خوارزمية متطورة تستخده المتغيرات التي بحوزتهم عن 
شخص ما gul‏ عن التصويت ال محتمل ال مفضل له )2012 .(Issenberg‏ وكانت النتيجة 
مليارات من أجزاء البيانات المترابطة والتي استخدمت للتعريف بالناخبين بشكل $253« 
وتقييم مدى احتمالية قيامهم بالتصويت والكيفية التي يصوتون dp‏ والكيفية التي قد 
يستجيبون بها لمختلف السياسات والقصص. لقد أنشأً الترابط بين البيانات في حملة 
أوباما ما اصطلح عليه )2012 (Crampton et al.‏ مصطلح «تأثير تضخيم المعلومات» 
(Information Aplifier Effect)‏ حيث مجموع البيانات أكثر من الأجزاء. 


السرعة :(Velocity)‏ 
هناك فرق جوهري بين البيانات الصغيرة والبيانات الكبيرة يتمثل في الطبيعة الديناميكية 
لإنتاج البيانات» فالبيانات الصغيرة تتكوّن عادة من الدراسات التي تكون مؤطرة بقالب 
جامد من حيث الزمان واممكان. وحتى في الدراسات المطؤلة» يتم التقاط البيانات في أوقات 
متفرقة ذات فاصل زمنى (على سبيل «JULI‏ كل بضعة أشهر أو سنوات). فعلى سبيل «JUI‏ 
يتم إجراء التعدادات السكانية بشكل عام كل خمس أو عشر سنوات» وف المقابل يتم 
إنشاء البيانات الكبيرة على أسس أكثر استمرارية بكثيرء s‏ كثير من الحالات بشكل 3l‏ أو 
لحظي وبشكل مباشر بالتقارب من الوقت الحقيقي للوقوع (Real-Time)‏ . وعوضا عن 
قدر ضئيل ومتفرق من البيانات» التي تجمع أو تعالج dà ace‏ فإن البيانات الكبيرة تتدفق 
بسرعة. ولذلك كان هناك انتقال ف التعامل من ال معالجة بالدفعات (Batch processing)‏ 
إلى السيانات المتدفقة )2012 .(Streaming Data) (Zikopoulos et al.‏ فمن Amb‏ 
يسهم هذا في مسألة كبر حجم البيانات من خلال إنتاج بيانات بسرعة أكبر» ومن ناحية 
أخرىء فهو يجعل كامل دورة البيانات أكثر ديناميكية بكثير» ويبرز LLAS‏ كيفية إدارة نظام 

السيانات المتغر باستمرار. 
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وتنبع السرعة من التكرار المستمر لتسجيل المشاهدات مع مرور الوقت و/أو تغير 
المكان )2009 (Jacobs‏ مع كون العديد من الأنظمة في وضع التشغيل الدائم باستمرار 
(Dodge and Kitchin 2005)‏ فعلى سبيل «JULI‏ تسجل المواقع الإلكترونية بيانات كافة 
الزيارات التي تمت للموقع والأنشطة التي قام بها الزائر خلال تصفحه على الموقع؛ كما 
تقوم المعدات الطبية بمراقبة العلامات الحيوية باستمرارء وتسجّل الكيفية التي يستجيب 
بها الجسم للعلاج وتُطلق إنذارا في حال تجاوزت هذه العلامات i>‏ معين؛ وتتعقب شركات 
الهاتف المحمول موقع» وهوية» وطبيعة استخدام الأجهزة الموصولة على شبكاتها كل بضع 
نوان؛ وبامثل ترصد شبكات استشعار الطقس مؤشرات الغلاف الجوي كل بضع دقائق 
وترسل نتائجها إلى قاعدة بيانات مركزية لإدراجها في الاستطلاعات الجوية؛ ويسجّل جهاز 
استشعار الذبذبات الراديوي (Transponder)‏ على طول طرق اطدينة البرية واللسكك 
الحديدية هوية الحافلات والقطارات التي تمرٌء مما يتيح لسلطة النقل العام معرفة أماكن 
مركباتها في آي وقت» واحتساب الوقت المقدّر للوضول في محطات التوقف المختلفة؛ كما 
تراقب متاجر التجزئة مبيعات الاف المنتجات ال مختلفة للآلاف من العملاء حيث تستخدم 
البيانات «لعرفة أوقات إعادة dus‏ الرفوف وطلب دفعات جديدة من الموردين؛ ويتواصل 
الناس بعضهم مع بعض من خلال مواقع وسائل التواصل الاجتماعي في سيل لا ينتهي 
من التادلات والعلاقات JI‏ 4 المتشادكة؛ ويرصد ال مرقاب (Telescope)‏ باستمرار السماء 
لقياس التقلبات في موجات الراديو من أجل فهم أفضل لطبيعة الكون» ففي كل هذه 
الحالات» هناك تيار مستمر من البيانات التي تتطلب إدارة وتحليلا مستمرا. 

ويشكل نقل وإدارة كميات كبيرة من البيانات المنتجة باستمرار تحديا تقنيا بسبب 
التحديات الناشئة عن محدودية قدرة سعة التخزين مما يوجد اختناقات بشكل سريع 
في حركة مرور وتبادل البيانات. على سبيل «JULI‏ وكما أن فيديوهات موقع اليوتيوب 
(YouTube)‏ قد تتوقف أو يتأخر عرضها بسبب كون سعة SLS‏ الاتصال بالإنترنت ليست 
كافية لتواكب سرعة تدفق البيانات المطلوبء فإن SYI‏ نفسه مكن أن يقع ف حالة az‏ 
ومعالجة OLLI‏ حيث تكون الأنظمة عاجزة عن مواكبة تدفق السانات. وتشمل حلول 
هذه ال مشكلة زيادة سعة SLS‏ الاتصال. وتوظيف تقنبات فرز وضغط السيانات مما بقلل 
من حجمها ومن ثم وقت معالجتهاء وتحسين كفاءة خوارزميات ال معالجة وتقنيات إدارة 
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البيانات. كما Jie‏ تحليل سيل البيانات المتدفقة تحديا أيضاء لأن النظام Y‏ يسكن ف أي 
لحظة وعند أي نقطة» كما في حالات الأسواق «AU‏ حيث مكن أن يكون تحليل الصفقات 
لمايكرو ثانية من الزمن قيّما للغاية. وهناء تستخدم خوارزميات معقّدةء إلى جانب العرض 
ا ممرني للبيانات الديناميكية وهي في ilo‏ تغير مستمرء لتتبع وتقييم النظام. 


التنوع :)Variety)‏ 
قد تختلف البيانات الصغيرة والبيانات الكبيرة في طبيعتهاء كونها منظمة» أو غير منظمة 
أو شبه منظمة» وتتألف من الأرقام» النصوص» الصورء الفيديوء وغيرها من أنواع البيانات 
الأخرى. إلا أن هذه الأنواع المختلفة من البيانات يرجح أن تكون ف البيانات الكبيرة أكثر 
قابلية للجمع والربط بينهاء وإمكانية Log‏ البيانات المنظمة بالبيانات غير المنظمة. فعلى 
سبيل «JULI‏ تتألف نشرات الفيسبوك من النصوص التي ترتبط في الغالب بصور أو ملفات 
فيديو أو غيرها من اممواقع» وهي تجتذب تعليقات مستخدمي الفيسبوك الآخرين؛ كما 
قد تجمع شركة ما بين البيانات المالية المتعلقة با مبيعات واستطلاعات العملاء التي تعر 
عن مدى ثقتهم بال منتج» وفي المقابل تكون البيانات الصغيرة أكثر انفصالا وترتبط» على 
كل حالء من خلال مفاتيح تعريفية وحقول بيانات مشتركة. ويتمثل السبق الأساسي 
بالنسبة للبيانات الكبيرة في كيفية اختلافها عن الأشكال التي سبقتها لإدارة البيانات «da JI‏ 
والتي كانت احترافية للغاية في معالجة وتخزين البيانات الرقمية باستخدام قواعد البيانات 
العلائقيةء مما مكن من إجراء مختلف أنواع التحليل Las yl‏ إلا أنها كانت أضعف بكثير 
في التعامل مع نماذج البيانات الغير رقمية. عدا عن مجرد تخزينها في ملفات مجردّة أو 
مضغوطة. وكما لاحظ اتحاد مراكز السانات المفتوحة )7 :2012( Data Center Alliance‏ 
b‏ في السابق كان يجري تجاهل البيانات غير المنظمة» أو في أحسن «Jis MI‏ استخدامها 
بشكل يفتقر إلى الكفاءة. ومع «US‏ فإن التقدم الحاصل في الحوسبة الموزعة. وتصميم 
قواعد البيانات باستخدام هياكل عوضا عن لغات الاستعلام الهيكلية (NoSQL)‏ (انظر 
الفصل الخامس)»ء والتنقيب ف البيانات وتقنيات اكتشاف المعرفة (انظر الفصل السادس)ء 
قد زادت بشكل كبر القدرة على إدارة ومعالجة واستخراج ال معلومات من البيانات غير 
ا منظمة. وف الواقع» يجري على نطاق واسع تداول أن ما يقارب تمانين ف المائة من جميع 





7 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الرابع 


السانات الكبيرة هي غير منظمة بطسعتهاء وكما A28 (Grimes (2011) obl‏ أصبح هذا 
الرقم مسلّما به مع قليل من الإثبات. 


المرونة :(Flexibility)‏ 
يكون تصميم البحث وإدارة البيانات» مع مشاريع البيانات الصغيرة» غير مرن نسبيا 
بمجرد بدء العمل الميداني والتحليل» وذلك بالنظر إلى الخدمات اللوجستيةء والتكاليف 
والحاجة إلى التمثيل في عينه صغيرة الحجم. فعلى سبيل JALI‏ فإنه من الضروري على كل 
شخص تم gaz‏ بيانات التعداد له تعبئة النموذج ذاته للتأكد من إمكانية قابلية مقارنة 
البيانات عبر كافة السكان. وبمجرد طباعة النماذج» لا Sue‏ إضافة حقول بيانات Swa‏ 
مما يعني ثبات البيانات الممكن استخراجها من هذه التماذج. وبامثل Lë‏ قواعد البيانات 
العلائقية التي تحفظ بها البيانات إلى أن تكون قالبا ثابتا ومحدودة النظاق. وعلى نحو 
مماثل» يكون تصميم البحث عادةء في التجارب العلمية والدراسات البيئية» غير مرن بمجرد 
بدئهاء وذلك بهدف تمكين إجراء عمليات المقارنة والتكرار. أما في الدراسات التي تعتمد 
المقابلات أو الأنشطة الاجتماعيةء فمن ال ممكن للباحثء على الرغم من «US‏ أن يكون أكثر 
مرونة في النهج المتبع؛ bla‏ يكون لديه نموذج حر من الأسئلة وإمكانية التكيف مع الأوضاع 
المستجدة. وممكن أن يكون 3253 وإدارة وتحليل هذه البيانات LA lisa‏ ولكن هذا يعود 

جزثيا إلى محدودية حجم ونطاق مجموعة البيانات. 

في المقابلء تم تصميم نظم البيانات الكبيرة لتكون مرنة بطبيعتهاء بحيث تحمل 
سمات قابلية الاستطالة والتفرع (ممكن إضافة حقول بيانات جديدة بسهولة) وقابلية 
التوسع )6 5$ التوسع بسرعة) بغض النظر عن الحجم )2012 .(Marz and Warren‏ 
ويعني استخدام قواعد البيانات غير الهيكلية للاستعلام (NoSQL)‏ إمكانية إدارة البيانات 
المتغيرة بسرعة عالية» والتكيف مع حقول البيانات الجديدة (انظر الفصل الخامس). 
وهذا يعني أنه من الممكن التكيّف مع إنتاج البيانات على أسس تدويرية» وأداء الاختبار 
على التكيف. فعلى سبيل JUL‏ تقوم شركات جوجلء والفيسبوك» ومنصات أخرى 
على الإنترنت بتعديل تصاميمهاء وجمع بيانات حول LAS‏ استجابة المستخدمين لهذه 
التغييرات على سبيل «JE‏ مراقبة الزيارات العابرة للموقع» وتحليل النتائج واستخدامها 


|ev‏ ثورة البيانات البيانات الكبيرة» والبيانات ال مفتوحة:ء والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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لتقديم مزيد من التعديلات المحسنة للتصميم بغية تشجيع إجراءات وردود معينة 
بشكل مستمر. ولأن أعداد الأشخاص الذين يستخدمون هذه ال مواقع Alo‏ وأحجام 
العينات الخاصهة بهم كبيرة des‏ فهذا يعني أن بإمكانهم إجراء التغييرات دون الخوف 
من فقدان التمشل. على سبل «JULI‏ وبالعودة إلى حملة باراك أوباما الانتخابية: 
فقد أجرى فريق حملته تجارب متتالية عن مدى فعالية التعديلات المحسنة لموقع 
الحملة (BarackObama.com)‏ لزيادة المشاركة»ء والعمل التطوعي» والترعات. فأحد 
الاختبارات قيّم اثار التغيير على زر «اشترك» إلى «مزيد من المعلومات»»: و «انضم إلينا 
«OVI‏ و«اشترك الآن»: وأصبح من الواضح على مدى ثلانمائة ألف زيارة أن استخدام زر 
«انضم إلينا الآن» قد أدى إلى عشرين ف الطمائة زيادة ف الزائرين المقبلين على التسجيل 
قي اطوقع )2012 (Issenberg‏ 

فمل هذه المواقع الكبيرة الحجم ينبغي أن تكون أيضا قابلةاللتوسع والتطوير 
وقادرة على التعامل مع الطفرات الناشئة في طلب وإنتاج البيانات» حيث يتسبب مقدار 
حركة مرور البيانات ف انهيار قاعدة البيانات العلائقية التقليدية العاملة على خادم 
واحد. فعلى سبيل «JULI‏ يمكن أن يزداد عدد التغريدات التي يتعامل معها تطبيق 
التواصل الاجتماعي تويتر بشكل ملحوظء مع عشرات الالاف من التغريدات (UI‏ يجري 
نشرها JS‏ بضع ثوان أثناء الأحداث الكبيرة» مثل حفل افتتاح الألعاب الأوطبية أو خلال 
المباراة النهائية. وكان الحل هو تركيب أنظمة oke‏ تتألف من أجزاء موزعة بحيث 0553 
البيانات في قواعد بيانات مقسمة عبر العديد من الخوادم: مما مکن من توسيع نطاق 
التخزين بحسب الحاجة. وعلاوة على ذلك» ففي بعض الأنظمةء مثل تويترء يمكن تعيين 
المرونة من قبل ال مستخدمين لتحديد ما إذا كانت تشمل البيانات آم لا. على سبيل «JULI‏ 
يقرر المستخدمون في العديد من تطبيقات وسائل التواصل الاجتماعي وامتنقلة gl»!‏ 
أو عدم إدراج مواقعهم» وكذلك البيانات التعريفية الرئيسية الأخرى المتعلقة بالهوية 
.(Gorman 2013)‏ 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها Yer‏ 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الرابع 


الخلاصه: 

البيانات الكبيرة هي ظاهرة حديثة. وبالنظر إلى التطبيق والانتشار المتسارعين لهاء فقد 
رژ ت اتاک ات 6s la ae Baza‏ كل UBL‏ الكنرة واخ خان اللرقطة Mr‏ .تعد 
بعض التعاريف» مثل تلك التي تنص على أن البيانات الكبيرة هي أي مجموعة بيانات 
كبيرة جدا بالقدر الذي لا مکن معه تخزينها في جدول بيانات إكسل أو على جهاز واحد 
(Strom 2012)‏ مبتذلة للغاية وغير مفيدة» حيث تخفض مستوى مفهوم البيانات الكبيرة 
إلى خاصية الحجم فقط. لقد أصبح من الواضح أن لدى البيانات الكبيرة عدد من الخصائص 
الملازمة لها والتي تجعلها مختلفة نوعيا عن الأشكال السابقة من البيانات» وتم في هذا 
الفصل مناقشة الخصائص الأساسية السبعة للبيانات الكبيرة: الحجم» والسرعة: والتنوع 
والشمولء والدقة / الفهرسة» والعلائقية: والمرونة / قابلية التوسع التي تميزها عن البيانات 
الصغيرة (انظر الجدول .)١-۲‏ 


فهذه هي دورة المستوى الأول فيما يتعلق بتقديم تقييم توصيفي لطبيعة البيانات 
الكبيرة. وهناك حاجة إلى مزيذ من العمل لتقييم البيانات الكبيرة الناتجة عن مصادر 
متعددة لتحديد ما إذا كان هناك أصناف متنوعة في طبيعة البيانات الكبيرة. فعلى سبيل 
لمثالء قد تحمل بعض البيانات خمسا Uu Sd‏ من هذه الخصائص..ولكنها لا ggas‏ أو 
ضعيفة في واحدة أو اثنتين» وقد تفتقر مجموعة بيانات إلى التنوع (منظمة بشكل GS‏ أو 
الحجم (صغيرة» ولكن شاملة مع حجم العينة ن = الجميع)» أو قليلة السرعة )5 إنشاء 
البيانات بانتظام ولكن في كل شهر عوضا أن تكون بشكل مستمر). أو تفتقر إلى الفهرسة 
(كونها مجهولة المصدر أو مجمعة). مع حملها للخصائص الأخرى على سبيل المثال. فمن 
الواضح أن مثل هذه البيانات ليست بيانات صغيرة كما هو مبين ف الفصل الثاني. ولكنها 
في ذات الوقت ليست بيانات كبيرة كما تفهم بمعناها الضيق الذي يصفها بكل الخصائص 
السبع» ولكن يمكن اعتبارها على الرغم من ذلك شكلا من أشكل البيانات الكبيرة. وبعبارة 
51 ,5« هناك حاجة لإنتاج تصنيف للبيانات الكبيرة قائم على أدلة تجريبية قوية مع أمثلة 
الحالات التي من شأنها أن تساعدنا على التفكير بصورة أكبر في طبيعة هذه البيانات. 
ويحتاج هذا إلى أن يكون مصحوبا بدراسة للخصائص الأخرىء مثل نوعية البيانات وصحتها 
ودقتهاء ومنشئها (انظر الفصل التاسع). 


عع ١‏ ثورة البيانات البيانات الكبيرة» والبيانات ال مفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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السانات الكبيرة 


كما تثير الخصائص السبع للبيانات الكبيرة تساؤلات بشأن الآثار المترتبة على طوفان 
مثل هذه البيانات» وما الذي يعنيه القدرة على الوصول إلى بيانات كبيرة جداء وشاملة 
ومتغيرة» ALSI‏ ومفهرسه. deging‏ وعلائقية: 45,25( وقابلة للتوسع بالنسبة للمجتمع 
والحكومة ورجال الأعمال؟ وإلى أي مدى يمكن أن توفر هذه البيانات رؤى ثاقبة عن 
حالة الإنسان أو المساعدة على تناول بعض القضايا الاجتماعية, والسياسية» والاقتصادية: 
والبيئية الأكثر إلحاحا والتي تواجه كوكب الأرض؟ أوء بدلا من خدمة الصالح العام» فهل 
ستستخدم هذه البيانات لمزيد من خدمة ال مصالح الخاصة ف الغالب؟ أو خدمة مصالح 
الدولة؟ وكيف سوف تغير هذه البيانات في نظرية المعرفة العلمية في جميع المجالات 
lY)‏ والعلوم الإنسانية: والعلوم الاجتماعية» والعلوم الفيزيائية والحياتيةء والهندسة)؟ 
فالفصل السابع والثامن والعاشر ستناقش هذه القضايا بالتفصيل» وتقدم التفكير النقدي 
لآثار وعواقب البيانات الكبيرة. 


859 البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها £o‏ 
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ممكنات السانات الكبيرة ومصادرها 


برز النمو السريع للبيانات الكبيرة نتيجة التطور المتزامن معه لعدد من التقنيات ae all‏ 
والبنى التحتية» والأساليب «Loy ls‏ وتضمينها بشكل سريع ف الأعمال اليومية: وا ممارسات» 
وا لمساحات الاجتماعية. وتضمنت هذه البنية التحتية المعرفية الجديدة إطلاق طيف واسع 
من مجموعه degu‏ من CU‏ ال معلومات والاتصالات. وخاصة dass‏ الإنترنت الثابتة 
وامتنقلة عبر الهاتف المحمول؛ وإدخال البرمجيات في جميع الكائنات» والآلات والأنظمة: ناقلة 
Lali‏ من «الغباء» إلى «الذكاء». فضلا عن إنشاء أجهزة وأنظمة رقمية بحتة بالكامل؛ وتطوير 
الحوسبة الشمولية الواسعة الانتشار والقدرة على الوصول إلى الشبكات والحوسبة في العديد 
من البيئات» وعلى ذات خطى هذا التحرك؛ التقدم في تصميم قواعد البيانات ونظم إدارة 
المعلومات؛ وعروض التخزين الموزع. والتخزين الأبدي للبيانات بأسعار معقولة؛ والأشكال 
الجديدة من تحليلات البيانات المصممة للتعامل مع وفرة البيانات بدلا من ندرتها. 

وإضافة إلى تمكين الوصول والمشاركة والتخزين للبيانات» تعد البنية التحتية والمعرفية 
الجديدة في الغالب الوسيلة التي يتم إنتاج الكثير من البيانات الكبيرة منها. ففي الواقع» 
وبلا شك أن الحالة في وقتنا الحاضر تتمثل ف lul‏ نعيش ف مجتمعات تستخدم على نحو 
متزايد تقنيات البيانات المكثفة والمنتجة لها وتنتظم على أساسها. كما أصبحت ال ممارسات 
الشخصية ف الاتصالء والاستهلاك. والإنتاج والسفرء والحياة المنزلية: أكثر فأكثر تتوسّطها 
الأجهزة الرقمية التي تنتج الكثير من البيانات المستنفذة القيّمة. وعلاوة على «AUS‏ يتم 
الآن مراقبة وتنظيم الأماكن التي نعيش فيها على نحو متزايد بمجاميع كثيفة من التقنيات 
والبنى التحتية المدعمة بالبيانات» مثل أنظمة ال مرور وإدارة GLL‏ ونظم المراقبة والشرطة. 
وقواعد البيانات الحكومية» وإدارة العملاء وسلاسل الدعم اللوجستية» والأنظمة امالية 
ونظم المدفوعات. وستناقش العوامل المساعدة ومصادر البيانات الكبيرة بالتفصيل فى هذا 
الفصل. 


ثورة السبانات السانات الكبرةء والسانات امفتوحة› والبنى التحشة للسانات» والنتائنج ا مترتة عنها /اع ١‏ 
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الفصل الخامس 


العوامل المساعدة للسانات الكسيرة: 

تعد البيانات الكبيرة مُحصلة للتطور والتقارب بين مجموعة متقدمة من التقنيات ف 
مجال الحوسبة منذ نهاية الحرب LI‏ الثانية. ويشمل ذلك إنتاج أجهزة الحاسب 
امركزية في الخمسينيات والستينيات؛ وشبكات الإنترنت الوليدة في السبعينيات والثمانينيات 
التي ربطت الحاسبات بعضها ببعض؛ والانتشار الواسع النطاق للحاسبات الشخصية في 
الثمانينيات والتسعينيات؛ والنمو الهائل للإنترنت ف التسعينيات» وتطوير الصناعات القائمة 
على الويب» جنباً إلى جنب مع النمو الهائل في الهواتف النقالة والأجهزة الرقمية مثل أجهزة 
الألعاب والكاميرات الرقمية؛ وتطوير الحوسبة السحابيةء والموزعة:. والنقالةء وتقنيات 
الإصدار الثاني لشبكة الويب )2.0 (Web‏ في بدايات الألفية الثانية؛ وتفشي الحوسبة الشمولية 
واسعة الانتشار (Ubiquitous and Pervasive Computing)‏ خلال هذا العقد. وخلال 
هذه الفترة وقع اعدد من اممؤثزات التحويليةء فزادت القذرة dos ule]‏ أضعافاً مضاعفة 
وتم ربط الأجهزة da‏ وتداخلت الأنظمة الرقمية بازدياد متعاظم فى شئون الحياة اليومية 
وعملياتهاء وأصبحت البيانات أكثر من أي وقت مضى مفهرسة وقابلة للقراءة الآليةء كما 
توسعت أنظمة تخزين السيانات وأصحت موزعة. 


الحوسبة (Computation)‏ : 
بينما قدّمت الحواسيب الرقمية المركزية الأولية في الخمسينيات والستينيات قدرة 
حاسوبية أكثر كفاءة من تلك التي عند البشر والأجهزة التناظرية التي استخدموها (مثل 
cala sl‏ والآلات الحاسية ALAI‏ والآلات الحاسبة بالبطاقات المثقوبة» وأجهزة 
الحاسب التناظرية: إلخ)ء إلا أن قوة المعالجة لها كانت محدودة: ومن ثم كانت أنواع 
العمليات التي يمكن أداؤها مقيدةء وعلاوة على ذلك كانت تلك الحواسيب كبيرة الحجم 
ومكلفة. على سسيل «JULI‏ كان بإمكان حاسب Electronic Numerical) JL SV‏ 
(Integrator Analyser and Computer- ENIAC‏ الذي E‏ 3 منتصف الأربعينيات: 
clol‏ خمسة الاف عملية جمع وطرح ف الثانية» ولكن اقتصرت ذاكرته الرئيسية عالية 
السرعه على عشرين كلمة (أي UY (cob guli‏ تزن ثلاثين طنا وتحتوى ۱۸,۰۰۰ 
أننون فراغيء. و٠٠٠,١۱‏ مرخل» ومتات الآلاف من المقاومات وا مكثفات واممحاثات» 
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ويامب pase‏ مائتى كيلوواط من الطاقة الكهربائية )2004 .(Najmi‏ وق العام «e YA10‏ 
توقع Gordon Moore‏ من إنتل Ob‏ يتضاعف عدد الترانزستورات ف الدوائر المتكاملة 
كل ثمانية عشر شهرا في العقد المقبل ذلك الحين مما يزيد بشكل كبير القدرة الحاسوبية 
(وهو ما أصبح يعرف لاحقا باسم قانون مور). وقد أشنت هذا التوقع بصيرة Ca 633b‏ 
تم إدخال تحسينات تقنية على مكونات وتصميم أجهزة الحاسب (من خلال الانتقال 
من الأنابيب الفراغية إلى الترانزستورات إلى الدوائر المتكاملة إلى المعالجات المصغرة), 
ies‏ القوة الحسابية فيما يقرب من الخمسين lisi. GUIS‏ بين ١15٠ (uale‏ م 
۰م )2002 dlg (Nordhaus‏ جانب هذا النموء انخفضت تكلفتها بشكل کبیرء 
:5 تشير إحدى التقديرات بانخفاض ف تكلفة الحساب ناهز أضعاف الكوادريليون 
(Yee )‏ خلال القرن العشرين )2003 (CRA‏ 
استمرت مثل هذه الزيادات الهائلة في القدرة الحاسوبية والانخفاضات الكبيرة في 
التكلفة في الألفية الجديدة؛ ولكن الأهم من ذلك أنها أصبحت متنقلة على نطاق واسع 
مع انتشار مكثف للأجهزة الحاسوبية المحمولة مثل أجهزة الحاسب ال محمولء والأجهزة 
اللوحية والهواتف ASII‏ وأجهزة الملاحة ال مرتبطة بالأقمار الصناعية (SatNav)‏ وغيرها. 
وتعادل قوة ا معالجة للهاتف SUI‏ المتوسط "عشرة أضعاف قوة جهاز الحاسب ال مركزي 
كراي1- (Cray-1)‏ الذي تم تشغيله في مختبرات لوس ألاموس الوطنية في عام 1976م " 
(Townsend 2013: xiii)‏ مع استخدامها جزء من قوة معالجتها. حيث تمتلك قدرات 
حاسوبية» وتخزينية» وتطبيقات أكثر من العديد من أجهزة الحاسب الشخصية منذ 
عقد واحد فقط من الزمن» وهي Lal‏ تشغل جزء بسيط في حجم العتاد المستخدم. 
e‏ سل JELI‏ لدى العديد من الهواتف الذكية معالجا مصغرا بسرعة Y, - M0‏ 
غيغاهرتز و١۱‏ - Coblas YY‏ من الذاكرة الرئيسية. Esa‏ هذه القوة في امعالجة 
وسعة الذاكرة من معالجة كميات كبيرة lae‏ من البيانات بسرعة. ليتم تخزينها متخلا 
لأنها متصلة شىكىا ومشتركة. 
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الربط (Networking)‏ : 
بذات القدر من الأهمية للنمو الكبير في القوة الحسابية لمعالجة البيانات الرقمية كان 
الربط بين الحاسبات بعضها مع بعض والذي سهل نقل وتبادل البيانات فيما بينها. وقد 
وقع آول اتصال شبكي بين جهازي حاسب عبر شبكة الإنترنت في نوفمبر عام «e VAM‏ وقد تم 
الربط بين نقطة في جامعة كاليفورنيا في لوس أنجيلوس (UCLA)‏ ونقطة أخرى في جامعة 
ستانفورد )1995 (Salus‏ ثم نمت الشبكة ببطء. من ١١‏ نقطة فى plo‏ ١/191م,‏ إلى YY‏ ف 
أبريل e YAVY‏ إلى Y‏ في يونيو 191/6م: و۱۱۱ بحلول مارس e AVV‏ واقتصرت حينها على 
متعاقدي وكاله مشاريع البحوث المتطورة الدفاعية ARPA) (Hart et al. 1992; O Neill)‏ 
5. وتعمل شبكة الإنترنت من خلال تقطيع البيانات والتعليمات في حزم متساوية 
الحجم ونشرها عبر النظام: مع عنونة كل حزمة بمعرّف وعنوان المرسل إليه المطلوب» ثم 
تمرّر كل حزمة من نقطة اتصال إلى أخرى إلى أن تصل إلى الوجهة المقصودة حيث يتم إعادة 
تجميعها هناك. ولتمكين اتضال الأجهزة والشبكات التي تعمل على سرعات مختلفة على 
مدار الساعة وتستخدم حزما مختلفة quod]‏ اعتمدت مجموعة معيار (بروتوكول) الشبكة 
تي سي à‏ / آي بي (TCP/IP)‏ (معيار التحكم بالإرسال / بروتوكول الإنترنت) في عام ۱۹۷۳ 
(O'Neill 1995)‏ ولا يزال هذا المعيار يستخدم حتى يومنا هذا. كما يؤكد هذا المعيار على 
حيادية الشبكة» حيث يتم التعامل مع كافة البيانات على قدم ال مساواة ودون تمييز بينها أو 

تفاضل ف التكلفة )2011 .(Wu‏ 

وبحلول أواخر السبعينيات» تمّ إنشاء الشبكات ال محلية الداخلية: كما تم إنشاء الشبكات 
الأخرى دوليا وتمّ ربطها بشبكة الإنترنت الوليدةء إضافة إلى شبكات الهواة المستقلين 
والشركات» كما أصبح من الممكن إرسال حزم البيانات عبر الأقمار الصناعية. وبالإضافة إلى 
نقل البيانات واطلفات. تم إنشاء البريد الإلكتروني واللوحات الإعلانية )1998 (Kitchin‏ 
وخلال الثمانينيات» نمت البنية التحتيةء مع لاعبين جدد من المؤسسات والشركات» جنبا إلى 
جنب مع تطور شبكات الإنترانت الداخلية (الشبكات الخاصة). وفي عام ۱۹۹۲م اخترع تيم 
بيرنرز لي (Tim Berners-Lee)‏ من سيرن (CERN)‏ في جنيف الشبكة العاطية (الويب)ء 
وقدّم وسيلة سهلة الاستعمال أكثر بكثير للوصول إلى الإنترنت واستخدامها. وخلال 
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التسعينيات وبدايات الألفية الجديدة: تم تطوير تقنيات شبكية جديدة مثل شبكات اتصال 
اميدان القريب (NFC)‏ والتواصل اطباشر (Proximate Communication)‏ باستخدام 
معابير البلوتوثء. والتغطية المحلية اللاسلكية الواي فاي (WiFi)‏ والشبكات الوطنية 
للاتصالات المتنقلة (GSM/3G)‏ فقا لقوانين جورج غيلدر )2000( (George Gilde)‏ 
في الاتصالات» فإن إمدادات العام من عرض النطاق الترددي (قدرتها على نقل البيانات) 
تتضاعف كل ستة أشهر > مع مزيد من القدرة الإضافية التى تقدمها الشكات اللاسلكية. 
ونتيجة لهذه التطورات؛: فقد أصبح h» l‏ متاحا بين الأجهزة الحاسوبية من خلال شبكة 
الإنترنت بشكل أسهل على نحو متزايد. وأسرع وعلى نطاق أوسع. 


الحوسبة الشمولية واسعة الانتشار: 

صاحب التوسع ف النفاذية وقدرة الوصول إلى شبكات تقنية المعلومات والاتصالات 
وزيادة سعات قنوات الاتصال (عرض النطاق الترددي)ء تنوع وتوسّع ف الأجهزة الرقمية 
والتي تتصل إما بشكل مباشر أو غير مباشر (حيث يتم تحميلها على جهاز آخر (Yal‏ 
بشبكة الإنترنت لتبادل البيانات» أو التعليمات» أو الحصول على التحديثات اللرمجية. 
ففي بعض الحالات» حلت التقنيات الرقمية الجديدة محل الأشكال السابقة من البيانات 
التماثلية / التناظريةء فعلى سبيل «JUL‏ تم استبدال أنظمة الهاتف التماثلي بالهواتف 
المحمولة والهواتف ASII‏ واستبدلت كاميرات المراقبة التناظرية التي تسجّل على شريط 
فيديو بكاميرات رقمية تلتقط الصور JI‏ 3 ويجري الاستعاضة عن الموسيقا المخزنة 
على الشريط المغناطيسي أو الفينيل بملفات صوتية رقميةء والنماذج الورقية بأخرى 
إلكترونية على الإنترنت. من هناء تم تحويل الأجهزة والأنظمة التي كانت تعد نسبيا 
«غبية» لتصبح «ذكية» ببعض الطرقء وعادة من خلال استخدام البرامج المرتبطة بها 
(Dodge and Kitchin 2005)‏ وتعني كلمة «الذكية» هنا بشكل ob ele‏ الجهاز قد 
نيرت تسوه Lab Piu‏ للطريقة الخاصة التي يستخدم بها وقادرا على اتخاذ قرارات 
مستقلة. وانية» ومؤتمتة من مجموعة الخيارات المحددة من خلال تطبيق خوارزميات 
على البيانات المنتحة (انظر 20072 .(Dodge and Kitchin‏ وخر مثال على تجميع 
تقني «غبي» أصبح على نحو متزايد «ذي» هو السيارةء فالسيارة الحديثة يتم تحميلها 
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بأجهزة رقمية» ومستشعرات ومحركات» والتي تراقب وتنظم أنظمتها المختلفة وتتداخل 
مع تجربة القيادة )2004 (Thrift‏ ويممكن أن تنتقل البيانات المخزنة من هذه الأجهزة 
عبر شبكات الاتصالات عن بعد للشركات أو تحميلها من قبل مهندس لإجراء تحليل 
تشخيصي .(Dodge and Kitchin 2007a)‏ وق حالات ]45,2 هناك أجهزة لا مكافئ 
تناظريا Cu dy‏ تنتج بيانات جديدة كليا في شكلهاء مثل تلك الناتجة عن أنواع جديدة 
من التقنيات الرقميةء والمسح الضوقء وأجهزة الاستشعار على سبيل المثال» ماسحات 
التصوير بالرنين المغناطيسي MRI‏ في مجال الصحة؛ وإضافة إلى جعلها «ذكية»» فإن 
الأنظمة تعمل في الغالب على جمع P‏ قدر من البيانات قدر الإمكان» وتسعي لتكون 
هذه البيانات شاملة وليست انتقائية. وهناء قد يتم جمع Ollo‏ عرضية أو غير ضرورية 
لتوفير الخدمة أو العملية. مثل التفاصيل الشخصية أو الموقع الجغراق. فغالبا ما تُحدد 
الإعدادات الافتراضية للأجهزة بشكل يتيح للناس إمكانية اختيار الانسحاب من أنظمة 
إنتاج البيانات من خلال عقود الاستخدام للبرمجيات والممواقع» مع النص على العقوبات إذا 
اختاروا القيام بذلك» مثل تردي الخدمات» والتكاليف الإضافيةء أو حجب الخدمة بالكلية. 

وبا لمثلء. حصل هذا النمو ف الأجهزة الرقمية في الممنزل» وف الشارع. وف أماكن العمل 
وعبر شبكات النقلء وفي غيرهاء مما دفع المعلقين للافتراض بأننا قد ولجنا عصر (البرمجيات 
في كل مكان -2006 .(EveryWare) (Greenfield‏ !53« هذا هو pas‏ الحوسبة واسعة 
الانتشار في كل مكان» حيث يتم توزيع القدرة الحاسوبية وإتاحتها في كل OGK‏ مع العديد 
من الأجهزة الحاسوبية التي تعمل لكل شخص )2012 (Lucas et al.‏ فالحوسبة امنتشرة 
(Pervasive Computing)‏ هي إضافة للقدرة الحاسوبية وإتاحة الوصول إلى شبكات 
Logas‏ المعلومات والاتصالات للكائنات والميئات duas JI‏ الثابتة لجعلها تفاعلية و«ذكية» 
.(Dourish 2001)‏ وق الممقابلء فإن الحوسبة فى كل مكان (Ubiquitous Computing)‏ 
هي القدرة الحاسوبية التي تتحرك مع الشخص بغض النظر عن البيئة؛ كالأجهزة التي 
يحملها الناس مثل الهواتف الذكية وأجهزة الملاحة عبر الأقمار الصناعية التي تعتمد على 
الوصول إلى شبكات تقنية المعلومات والاتصالات لتقديم الخدمات. وإذا كان شعار الحوسبة 
امنتشرة هو الحوسبة «في كل شيء»» فإن شعار الحوسبة في كل مكان هو الحوسبة à»‏ كل 
مكان»» مع إبراز الحوسبه اممنتشرة لعمليات التباعد والتفرع (تضمين البرمجيات في مزيد من 
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الأجهزة) وإظهار الحوسبة في كل مكان لأوجه التقارب (جهاز رقمي واحد للقيام مزيد من 
امهام) )2011 .(Kitchin and Dodge‏ وبينما يلزم الحوسبة ال منتشرة أن تكون على إدراك 
موقعى /موضعى (Situationally Aware)‏ لتنفيذها بنجاح» تتطلب الحوسبة في كل مكان 
الإدراك امستمر للسياق واطوقع. 

:(Indexicaland Machine-Readable Identification) àJ Vl قابلية الفهرسة والقراءة‎ 


على مدى نصف القرن الماضيء أصبحت الظواهر في العام أكثر وأكثر تحديدا بشكل 
فريد ومن السهوله التقاطها كبيانات» بسبب التقنيات الرقميه وتقنيات العنونه ووضع 
العلامات الجديدة. مما زاد في درجة دقتها وعلائقيتها ومن ثم مستوى التفصيل ف تحليلهاء 
بالإضافة إلى تمكين ربط مجموعات بيانات أكثر (انظر الفصل الرابع). فعلى سبيل «JULI‏ 
تتميّز كل الأجهزة الرقمية التي تساهم في الحوسبة المنتشرة والحوسبة في كل مكان بمعرّف 
فريد مُفهرس» بحيث Oso‏ رمز تعريف حصري لکل منها مما یتح رصدها وتتبّعها على 
الدوام. وعلاوة على ذلك» فإن جميع عناصر إنترنت الأشياء (Internet of Things- IoT)‏ 
كوكبة واسعة من الأجهزة المتصلة بالشبكة: المحركاتء وأجهزة الاستشعارء تنتج بيانات 
مفهرسة مكن lazu?‏ بشكل فريد )2004 .(Gershenfeld et al.‏ وإضافة لذلك» فإن 
امعرفات الفريدة التي تم ربطها بالناس منذ زمن طويلء مثل جوازات السفرء والبطاقات 
الصحية. وسجلات التأمينات الاجتماعية. قد جرى تعزيزها من خلال أنظمة تحديد الهوية 
الرقمية والحيوية الجديدة التي تربطها بقواعد بيانات رقميه تتحقق من هويتهم Dodge)‏ 
.(and Kitchin 2005‏ وهذه تشمل أسماء ا مستخدمين وكلمات السرء وبطاقات السب 
المغناطيسية. والقارئات الرقمية لبصمة الأصابع» وقزحية العين» والحمض النووي. à»‏ كل 
«Js‏ تعد هذه ال معرفات مثابه المصافحة JI‏ 4.53« على الرغم من أنها تختلف ق مستواها 
من حيث الدقة والثقة. فعلى سبل «JULI‏ مكن لأسماء المستخدمين وكلمات ال مرور أن 
تسرق أو تزوّر بسهولة؛ في حين أن الحمض النووي هو أصيل وفريد لكل شخص ويحقق 
امعايير الأربعة الأولى من قانئمة كلارك (Clarke 1994b)‏ المتعلقة بالخصائص ال مرغوب 
فيها لتحديد هوية الكائن البشري بشكل فعال وهي: شمولية التغطية / النطاق (يجب 
أن متلك الجميع الخاصية نفسها)؛ التفرّد (يجب أن يمتلك كل شخص قيمة واحدة فقط 
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لهذه الخاصية: ولا يتساوى فيها آي شخصين)؛ الدوام (يجب أن لا تتغير قيمة الخاصية 
مرور الزمنء ولا تكون قابلة للتغيير أيضا)؛ اللزوم (معنى أن تعد الخاصية صفة طبيعية 
لا مكن إزالتها ولا غنى عنها). وهذه الصفات تتوافق مع الصفات السبع الأخرى وهي: 
القدرة على التحصيل/ الجمع؛ والقدرة على التخزين؛ والتفرد؛ والدقة؛ والبساطة؛ والتكلفة 
والتناسس؛ والقيول. 

وبا لمثلء فإن رموز التحديد المكانية هي أنظمة تحذد مواقع الأشخاص. والأماكنء 
والكائنات في جميع أنحاء العام» وتشمل خطوط الطول والعرضء وإحداثيات الخرائط 
الشبكية» والوحدات الإدارية مثل الرموز .(Zip Codes) à» jJ!‏ وتختلف هذه الأنظمة 
في نطاقها ودقتها (درجة التفصيل)ء وقد أصبحت أكثر دقة وتحديدا من أي وقت مضي. 
فعلى سبيل JEL‏ توس البيانات الإدارية بالنسبة إلى الملكيات الفردية أو قطع الأراضي بدلا 
من الأحماء؛ كما Jon‏ أي جهاز يحوي نظام تحديد ال مواقع العامي Global Positioning)‏ 
(System- GPS‏ اموقع 3 نطاق بضعة أمتار؛ وبدأت أنظمة الخرائط الوطنية بإسناد عدد 
كبير من الكائنات الناشئة بقعل بشري أو طبيعي في المخططات الخرائطية بمعرفات إقليمية 
فريدة. ويوجد معرفات فريدة أخرى شائعة على نحو متزايد للمنتجات (انظر الفصل 
(9l JI‏ والمعاملات (على سبيل (JULI‏ طلبات الشراء)ء والتفاعلات (Ae)‏ سبيل «JULI‏ البريد 
الإلكتروني UI Els‏ الهاتفية). 

وفضلا عن كونها أكثر قابلية للفهرسة والتبويب» أصبحت رموز تحديد الهوية قابلة 
للقراءة الالية WT‏ على نحو متزايد )2005 .(Dodge and Kitchin‏ على سل «AULA!‏ 
يحتوي الرمز الشريطي (Barcode)‏ على رمز تعريف يرتبط بنظام معلومات يحتفظ ببيانات 
وصفية إضافية تصف الكائن عند مسحه بقارئ ليزري (مثل نوع امنتج / النموذجء تاريخ 
ومكان الصنع: الأسعارء وما إلى ذلك). كما يمكن استشعار رقائق تحديد الهوية باستخدام 
موجات الراديو (RFID)‏ عن بعد من قبل مستجيب راديوي والتعرف عليها. ويمكن 
كذلك التعرف على المركبات بواسطة برنامج التعرف JI‏ على أرقام لوحاتهاء وقد تم 
تطوير تقنيات خوارزمية جديدة للتعرف وتحديد هويه الوجوه وطريقه اممشي ( كيف مشي 
الناس). وهكذا أصبحت عناص ر/ كائنات العام مفتوحة لجمع والتقاط بياناتها وتحديد 
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هويتها تلقائيا؛ مما يوسّع بشكل كبير نطاق البيانات المنتجة ومدى دقتها بالنسبة إلى نظام 
ماء مما قدم أشكلا جديدة من التنظيم والحوكمة (Dodge and Kitchin 2007a)‏ وعزز 
عمل الأنظمة بطرق أكثر آلبة )2011 .(Kitchin and Dodge‏ لذا فإن الاتجاه السائد هو 
اممزيد والمزيد من التحديد للظواهر والممارسات لتصبح معرّفة بشكل فريد وقابلة للقراءة 
«LU‏ مما يزيد الدقةء والعلائقيةء والأتمتة. 


تخزين السيانات :(Data Storage)‏ 
كان هناك تحول «uS‏ على مدى العقدين الماضيين» في القدرة على التخزين الطويل 
الأمد لكميات هائلة من البيانات» ففي البداية تم تخزين البيانات الرقمية في صورة تناظرية 
باستخدام البطاقات المثقوبة وذلك قبل أن يتم الانتقال إلى الشريط ا مغناطيسي والأقراص 
الصلبة. وقد استكملت هذه الوسائل باستخدام وسائط التخزين الرقمية المتنقلة والتى 
تعرف باسم الأقراص المرنة (Floppy Disks)‏ وتلا ذلك ظهور الأقراص المدمجة (CDs)‏ 
وأقراص الفيديو الرقمية (DVDs)‏ ومحركات الأقراص الخارجية والذاكرة المتنقلة Flash/)‏ 
.(External Drives‏ وقد دفعت تقنات الأقراص (Hard-disk Technologies) Lal‏ 
على وجه الخصوص. بالقدرة على تخزين البيانات الرقميه بشكل كبيرء وذلك مع النمو 
الكبير للسعة التخزينية المقدرة بالخانة الثنائية لكل بوصة مربعة (بت/إنش2). في حين 
انخفضت التكلفة لكل غيغابايت بشكل كبير وبعامل يقدر بعشرة ملايين إلى واحد من عام 
6 حم إلى 2000م )2000 (Gilheany‏ واستمرت الأسعار في الهبوطء مما جعل التخزين 
الرقمي أرخص تكلفة بكثير وأقل مساحة من الأشكال التناظرية (على سبيل «JULI‏ الورق أو 
po‏ طة الفلمىة) )2003 «QV. .(Grochowski and Halem‏ اأصحت التكالىف رخيصة 
جدا وبالشكل الذي يمكن من تخزين كميات هائلة من البيانات بمقابل بخسء 0929 
الحاجة تقريباً لحذف الملفات القدهة. ونتيجة لذلكء فإن ا معاملات التي تجري اليوم de)‏ 
سبيل JELI‏ رسالة أرسلت إلى قائمة البريد الإلكتروني أو صفحة موقع التواصل الاجتماعي 
الفيسبوكء أو المدفوعات إلى متجر باستخدام بطاقة الائتمانء أو المحادثة مع أحد الأصدقاء 
على الهاتف) من الممكن تسجيلها وحفظها بشكل جيد إلى ما بعد وفاة الشخص اطعني dap‏ 

مع إمكانية الإشارة إليها وتحليلها في أي وقت في المستقبل. 
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ونتيجة لذلك» وكما نوقش ف الفصل السابقء كان النمو في حجم البيانات المخزنة 
بالأرقام المطلقة والنسبية استثنائيا. وخاصة منذ العام2000م. فعلى سبيل ال مثالء قدّر 
Hilbert and López (2009)‏ أن خمسه وعشرين ف المائه فقط من البيانات تم 
تخزينها في شكل رقمى في ele‏ 2000 مع الاحتفاظ ها تبقى بأشكال تناظرية مثل الكتب» 
والمجلات: والصورء والأشرطة الممغنطة. وبحلول عام 2007 «e‏ شكلت البيانات الرقمية ما 
نسبته أربع وتسعون ف المائة من مجموع البيانات المخزنة» ومنذ ذلك الحين تواصل النمو 
للحصة النسبية من البيانات الرقمية» خاصة مع تطور التخزين والخدمات ال موزعة من 
خلال الحوسبة السحابية ومراكز البيانات. وتأخذ الحوسبة السحابية أحد شكلين يعملان 
في الغالب بصورة تعاونية: سحب المرافق الخدمية (Utility Cloud)‏ وسحب البيانات 
التخزينية )2011 .(Data Clouds) (Farber et al.‏ فالسحب الخدمية توفر القدرات 
والإمكانات المتعلقة بتقنية ا معلومات كخدمات حسب الطلب حيث مكن الوصول إليها 
عن cayo dub goo‏ وذلك الأشكل مستقل ع موقع Jaiga clo‏ ذلك 
«البنية التحتية كخدمة» (Infrastructure as a Service- IaaS)‏ مثل التخزين والخوادم 
والشبكاتء «المنصة كخدمة» (Platform as a Service- PaaS)‏ وتضم dio‏ التنفيذ 
لتطوير تطبيقات مخصصة وقواعد السيانات» و«الرمجيات كخدمة» Software as a)‏ 
(Sservice- SaaS‏ والتى OSE‏ ال مستخدمين من الوصول إلى التطبيقات ومعالجة البيانات 
عن بعد )2012 Farber et al. 2011; Hancke et al.‏ ). في Ke av‏ سحب البيانات 
من ربطء تخزينء ومعالجة كميات هائلة من البيانات التي قد تنتج عبر المؤسسة عن 
بعد بالاعتماد على القدرة الحاسوبية Ub‏ من VI‏ 592 وتحليلها عن طريق سحب 
المرافق الخدمية )2011 (Farber et al.‏ ومن ثم» مكن للأفراد والشركات الاستفادة 
من التخزين والقدرة الحاسوبية دون الحاجة إلى القيام باستثمارات رأسمالية كبيرةء فضلا 
عن كونها قادرة على الاستفادة من هذه الموارد من ü‏ مكان يتوافر فيه اتصال بالانترنت 
(Bryant et al. 2008)‏ 

وبالمثل» كان هناك تحول في كيفية تنسيق البيانات وهيكلتها عند 553 dpa‏ وبسبب 
الزيادة الناشئة في حجم. de wg‏ وتنوع البيانات» فقد عانت قواعد البيانات العلائقية 
للبقاء ومواجهة الموقف. فقد صمّمت لبيانات على درجة عالية من التنظيم: والسلامة 
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والمنظمة. والثابتة. وبدلا عنهاء ظهر شكل جديد من قواعد البيانات هو قواعد البيانات 
غير الهيكلية (NoSQL)‏ مما يتيح تخزين البيانات الكبيرة. وتميل قواعد البيانات غير 
الهيكلية إلى أن تكون أقل تعقيدا في الشكل من قواعد البيانات العلائقيةء ولكن يمكنها 
التعامل مع كل من البيانات المنظمة (Structured Data)‏ وغير امنظمة Unstructured)‏ 
(Data‏ وهي قابلة للتوسع de pus‏ ومكنها التعامل فعلا مع العديد من مجموعات 
بيانات سريعة التغير وهائلة في الحجم» وتمتاز با مرونة في كيفية تنظيمهاء مما يتيح هياكل 
بيانات مفصلة بحسب الطلب )2012 (Driscoll 2012; Marz and Warren‏ كما 
تميل قواعد البيانات غير الهيكلية إلى تخزين البيانات الابتدائية الخام بدلا من المشتقة 
التي يتم هيكلتها وفقا لعلاقة محددة سلفا )2012 .(Driscoll‏ فعلى سيل JUL‏ » تخزن 
قواعد البيانات غير الهيكليهة معلومات el‏ عن زيارة صفحة الويب (المشاهدة) بدلا 
من تخزين alas‏ المناهدات للصفحات ال مشتقة منهاء وهي اإستراتيجية أكثر قوة من 
حيث أنها تقلل من الأخظاء المحتملة في قواعد البيانات» ولكن هذه الإستراتيجية لا مكن 
تطبيقها مع قواعد البيانات العلائقية بسبب النمو السريع والحجم الناتج من ذلك النمو 
والذي Y‏ مكن التعامل معه من خلالها )2012 .(Marz and Warren‏ ويتم ق العادة 
توزيع البيانات وتكرارها عبر العديد من الأجهزة في قواعد البيانات غير الهيكلية بدلا من 
مركزيتها في مكان واحد (ومن ثم حل مشکله معا البيانات الكبيرة جدا كونها كبيرة 
جدا عن أن يجري احتواؤها على جهاز واحد)» > وتقسّم طلبات الاستعلام ويجري تنفيذها ف 
الوقت نفسه على عدد من الأجهزة جنبا إلى جنب ثم يُعاد تجميع النتائج (ومن ثم تسريع 
.(Dumbill 2012) (dold UL ssl‏ وتتلخص هذه اللإستراتيجية من خلال 44135 
التعيين والاختزال (ReduceMap)‏ التي تم تطويرها من قبل شركة جوجل حيث يتم تعيين 
البيانات والاستعلامات على عدة خادمات ومن ثم جمع النتائج الجزئية واختزالها معا 
.(Dumbill 2012)‏ ويعد هادوب (Hadoop)‏ الذي تم وضعه بداية من قبل شركة ياهو 
(Yahoo)‏ مثالا على قواعد البيانات غير الهيكلية ومفتوحة المصدر وشائعة الاستخدام في 
تطبيق نموذج التعيين والاختزال. فالحل البديل بمثل هذا النهج يتمثل باستخدام نموذج 
أكثر محدودية للبيانات» ودرجة أقل من العلائقية في مجموعة البيانات» وقدرة أقل على 
الاستكشاف باستخدام لغة الاستعلام العلائقة )2012 .(SQL) (Driscoll‏ وهذا يعني 5l‏ 
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قواعد البيانات غير الهيكلية مثالية للتخزين الفعّال والاسترجاع السريع لكميات هائلة من 
LLI‏ ولكنها أقل فائدة لفحص العلاقات بين عناص السانات (مركز تحالف البيانات 
امفتوحة 2012 Open Data Center Alliance‏ 


مصادر السانات الكسرة (Sources of Big Data)‏ : 
وفر التوسع الجذري والتكامل بين الحوسبةء والشبكات» والأجهزة الرقميةء وتخزين 
البيانات منصة قوية لانطلاقة البيانات الكبيرةء وإضافة لذلك الوسيلة التي يتم بها إنتاج» 
ومعالجة. ومشاركة: وتحليل البيانات الكبيرة. ويمكن تصنيف هذا الإنتاج للبيانات في ثلاث 
فئات رئيسية. البيانات الموجهة (Directed Data)‏ والتي يتم إنتاجها بوسائل مراقبة 
تقليدية. حيث تتركز أنظار التقنية على شخص أو مكان من قبل Jéis‏ بشري. أما في حالة 
السانات الآلية (Automated Data)‏ فتنتج البيانات عن وظيفة كامنة في الجهاز al‏ النظام 
بطريقة تلقائيةء في حين يتم تداول البيانات الطوعية (Volunteered Data)‏ وإهداؤها من 

قبل الناس للنظام. 


السانات الموجهة :(Directed Data)‏ 
توجد امراقبة المنظمة والهيكلية حيثما وجدت مجموعة من الناس الذين يشرفون 
على أشخاص آخرين كالمسؤولين عن إنفاذ القانونء وا معلمين» والأطباءء ومسؤولي الرعاية 
الاجتماعية: والبيروقراطيينء ورؤساء العمل والذين يعملون على مراقبة الآخرين شخصيا 
كامواطنينء والتلاميذء والمرضىء والعمال أو من خلال العدسات التقنية كالمسوح مثل التعداد 
السكاني» ونماذج البيانات الحكومية»ء وإيصالات الضرائب» وعمليات التفتيشء وكاميرات 
مراقة الدوائر التلفزيونية ا (CCTV) a Als‏ حيث o‏ كانت امراقة اطنظمة والصشكلية 
مكل كترة طويلة loa Sa daa‏ اعسات ssa PEE Pa asas‏ مكيقات الرولة 5 dao‏ 
الشركات )2007 .(Lyon‏ فهذا النموذج للتحكم (التداخل ال منطقي» الأدوات» المؤسساتء» 
وأدوار وإجراءات الحوكمة) يتيح مركزية التنظيم والتحكم عبر مجموعة واسعة من 
ا مجالات» ويساعد ف الحفاظ على النظام» وإنتاج حكومة جيدة: وإدارة Aled‏ وعمل guya‏ 
ومجتمعات مستدامة ومستقرةء من خلال المحاسبة الفعالة للأشخاص والتهذيب IJI‏ 
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أيضا (معنى» تعديل الناس سلوكهم ليتوافق مع التوقعات والقواعد). وتستكمل هذه 
النظم بطرق تحديد هوية الأفراد. مثل بصمات الأصابع» والصورء وأرقام التأمين الوطني أو 
الضمان الاجتماعي» وجوازات السفر ورخص القيادةء التى تجعل من السهل تتبع واقتفاء 
آثر الناس» كما تم توسيع نطاق الطمراقبة ليشمل الحيوانات والبيئات» واستخدام الكائنات 
وحركتها. 

وحتى وقت قريبء كانت كل عمليات امراقبة جزئية وتناظرية بطبيعتها وتنتج 
مسعوياك مختلفة عق id au] Bd.‏ ددا عن ad oo XI‏ المسهلة إل السكلات 
التفصيلية أو التسجيل المستمرء ويجري تطبيقها أحيانا على عينات وفي حالات قليلة على 
المجتمع بأكمله. وكانت البيانات المسجّلة انتقائيةء تجمع من خلال التقارير أو الإبلاغ 
UI‏ على الورق أو على شريط مغناطيسي أو فيلم؛ في مكان وزمان معيّنين. وتميل البيانات 
إلى أن تكون منظمة للغاية في طبيعتهاء ومقتصرة على مجموعة من حقول البيانات المحددة 
مسبقا. وكانت السجلات ضخمة ومكلفة في التخزين: مما يعني عدم الاحتفاظ الطويل 
الأمد بها إلا لكمية محدودة من البيانات» إضافة إلى كون الكثير منها إما عبارة عن عينة 
أو مشتقة. وحتى في الحالات التي قد تكون المراقبة فيها مستمرةء مثل الدوائر التلفزيونية 
امغلقةء فقد تمتد اللقطات نفسها على فترات زمنية طويلة تتعدى قدرة الشريط التسجيلي 
على تغطيتها ويجري في العموم إعادة التسجيل عليها بعد فترة معينة (غالبا بعد سبعة 
أيام أو شهر). كما كان تحليل البيانات الناتجة من مختلف أشكال الطمراقبة اللستخدمة 
يتمّ بواسطة مفسّر بشري إلا إذا جرى تحويلها رقميا في وقت لاحق. ds‏ حين أن كميات 
البيانات التي تنتجها هذه المراقبة يمكن أن تكون ضخمة» وربما تستوفي واحدة أو اثنتين من 
الخصائص المرتبطة بالبيانات الكبيرة مثل قابلية الفهرسة والشمولية والعلائقية أو السرعة. 
إلا أنه لا (o Sas‏ حال أن تستوف مجموعة الصفات المرتبطة بالبيانات الكبيرة كاملة. 

وفي حين لا تزال العديد من أنظمة المراقبة والحوكمة مستمرة في كونها جزئية وتناظرية, 
كان هناك تحرّك في الآونة الأخيرة لاستبدالها والتوسع فيها بنظائر رقمية مكافئة لها والتى 
تنتج الآن بيانات كبيرة. فعلى سبيل «JULI‏ يجري استبدال أنظمة الدوائر التلفزيونية 
المغلقة التماثلية الثابتة بأخرى رقمية متحركة حيث كن تغيير مجال الرؤيةء والتقليل من 
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امحددات على التخزينء وتعزيز التفسير البشري بتحليلات خوارزمية dolus‏ مثل التعرف 
على الوجه أو طريقة ال مشيء كما مكن ربط مثل هذه البيانات مع قواعد بيانات أخرى. 
وهناء يوجّه تركيز الكاميراء وعمليات التحليل والتفسيرء من قبل مشغل بشريء وبمساعدة 
من البرمجيات. على سبيل JULI‏ من ا ممكن مراقبة وضبط العديد من الكاميرات في 
غرفة عمليات الشرطة وربطها بسجل الحوادث الحية من أجل الاستجابة بكفاءة وتوجيه 
اموارد امناسبة مواقع معينة بشكل استباقي. وبامثلء في مراقبة الهجرة والجوازات» حيث 
يجري آنيا جمع معلومات الركاب التفصيلية وتدقيقها مع مختلف قواعد البيانات الأمنية 
والحدودية بشكل الى أو (Real-Time) „hoJ‏ وإنتاج بيانات جديدة مثل ال مسح الضوني 
للصور الشخصية ويصمات الأصابع أو قزحية العين. وتستخدم العديد من الحكومات 
المحلية da lo] ih]‏ لتسجيل مشاركات المواطنين مع خدماتها Lal‏ وزد إن كان تعامل 
الموظفين مع أي قضايا قد تم ضمن أطر زمنية محددةء مع مراقبة مديري الإشراف للنظام 
لإعادة توجيه الموارد بحسب الحاجة. 

وتتكوّن بعض الأنواع الأخرى الأقل انتظاما ف إنتاج البيانات الكبيرة الموجهة من: 
التصوير الجوي الرقمي عن طريق الطائرات أو الطائرات بدون طيارء أو الفيديو المكانيء 
أو اللبدار (الرادار بتقنية الليزر) لكشف الضوء وتحديد مدى ias I‏ أو الحرارية أو غيرها 
من أنواع الأشعة الكهرومغناطيسية للبيئات التى تمكن من الرسم المتحرك للخرائط الثنائية 
والثلاثية الأبعاد للمناظر الطبيعية المفهرسة مكانيا بشكل آني أو لحظي (Real-Time)‏ من 
خلال نظام تحديد المواقع العالمي (GPS)‏ وتنتج مثل هذه الفيديوهات والمسوح بالأشعة 
كميات هائلة من البيانات المتنوعة dle‏ السرعة. فعلى سبيل «JE‏ يمكن لماسح الليدار 
توليد مليون نقطة بيانية» مع دقة بيانية تصل إلى بضعة سنتيمترات» مع إمكانية إجراء أكثر 
من مسح خلال الثانية الواحدة. إن وضع ماسح ليدري في مركبة وقيادتها في الأنحاء أو 
الطيران به فوق منطقة معينة ينتج تمثيلا ثلائي الأبعاد مفضّلا للغاية للتضاريس الطبيعية 
لتلك ال منطقة. 
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: (Automated Data) الآلية‎ LI 

ف حين وسّعت البيانات ال مموجّهة أنظمة المراقبة والحوكمة التقليدية. فقد حول إنتاج 
البيانات الآلية بشكل جذري كيفية إنتاج البيانات وتوظيف استخداماتهاء ومكن من إنشاء 
أنظمة جديدة للتنظيم والإدارة التلقائية Dodge and Kitchin 2007a, Kitchin and)‏ 
‘Dodge 2011‏ انظر الفصل العاشر). فمن خلال مجموعة من التقنيات الرقمية يتم إنشاء 
البيانات تلقائيا بواسطة مجموعة من النظم الآلية وبرقابة بشرية قليلة. وعلاوة على 
ذلك يتخ في الغالب معالجة وتحليل مثل هذه البيانات تلقائيا وبشكل مستقلء إذ يجري 
العمل عليها بواسطة خوارزميات برمجية لتحقيق نتيجة معينة تهدف إلى تنظيم ظاهرة 
ما. وهناك طرق عديدة لإنتاج البيانات ÀJI‏ بعضها قد يكون إنتاجه انوا عن النظام 
وليس من صميم عمله. 


المراقة :((Automated Surveillance) 4JV!‏ 
كما أصبحت تقنيات المراقبة رقمية بطبيعتها ومرتبطة بعضها ببعضء فقد أصبح من 
الممكن أيضا أتمتة جوانب متعددة لنظام المراقبة. وإضافة تقنيات جديدة, لتتبع أكثر فعالية 
وكفاءة في مراقبة وتتبع الاستخدام للأنظمة والأماكن المختلفة. وتعد قراءة العدادات 
الذكية مثالا على النموذج اليدوي من المراقبة التي غدت آلية بشكل متزايد. هناء يتم 
استخدام 44:35 قراءة العداد (Automatic Meter Reading- AMR) Ui‏ طراقبة استخدام 
JVI‏ 4 والتواصل معها دون الحاجة إلى القراءة البدوية التقليدية )2013 (Hancke et al.‏ 
وعلاوة على ذلك يمكنها القيام بهذه المهام بشكل متواصل مما يمكن ال مورّد من تتبع 
الاستخدام بشكل آني أو لحظيء وهذا له فائدة في مطابقة الطلب مع العرض às‏ العثور 
على أخطاء / تسريبات في النظام. كما أنها توفر وسيلة للقيام بالفوترة الآليةء مما io‏ من 
نفقات التوظيف. وف كثير من الحالات» من الممكن للمستهلك أيضا أن يراقب استهلاكه 
الخاص لخدمة duszo‏ مثل الكهرباء أو الغاز أو المياه. فعلى سبيل «JULI‏ مكن استخدام 
تطبيق للهاتف الذى للاتصال بعداد عن بعد باستخدام تقنية اتصال المجال القريب على 

سبيل JELI‏ البلوتوث: ومن ثم تغيير الاستهلاك تبعا لذلك. 
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وبا لمثلء تعزز أنظمة إدارة ال مرور من القدرة على تنظيم وضبط السائقين من خلال 
الاستفادة من تقنية التعرف AMI‏ على أرقام لوحات Automatic Number Plate) SLS AI‏ 
.(Recognition- ANPR) (Dodge and Kitchin 2007a‏ فهناء تمسح الخوارزميات 
بيانات الصور من الكاميرات الرقمية للكشف عن لوحات الترخيص. ومن dam‏ يمكن 
استخدام هذه ال معلومات لتتبع ال مركبات خلال عبورها على طرقات ال مدينة وتقديم مدخلات 
إلى نظم النقل الذكية «(Intelligent Transportation Systems- ITS)‏ ومن جهة 552« 
مكن إحالة هذه البيانات إلى قاعدة بيانات مالي المركبات لإدارة الغرامات والعقوبات 
المتحلقة بالمخالفات المرورية. فعلى سبيل «JL‏ بالنسبة للمثال السابق: يتم فخص i»‏ 
الترخيص لجميع المركبات الداخلة إلى منطقة الزحام 559,1( في لندن ومطابقتها مع قاعدة 
بيانات تلك المركبات التي سددّت رسوم الازدحام» أما تلك التي لم تسدّد خلال فترة أربع 
وعشرين ساعة فيتم تغريم مالكيها تلقائيا من خلال عملية الإدارة 4JVI‏ (يتمتع النظام 
باستقلالية في إصدار الغرامات دون الحاجة لرقابة بشرية). ويمكن للنظام بالمثل استخدام 
كاميرات السرعة لإصدار قسائم تجاوز السرعة للسائقين ال مخالفين. 

وف حالات أخرىء تم تسهيل امراقبة الآلية من خلال استخدام رموز الهوية المقروءة 
آليا لتسجيل ماهية الأنشطة المريبة/ المجهولة على شبكة المراقبة. فعلى سبيل JELI‏ ته 
استبدال التذاكر الورقية التي يتزايد تبادلها في السفر على نظام النقال من غير حامليها 
بالبطاقات الذكيه» التي ينبغي التدقيق عليها لدخول وخروج ال محطات ووسائل النقل. 
ويتم إنشاء سجل عند نقاط ال مسح ومن ثم يمكن تتبع كل حركات حاملىي البطاقات الذكية. 
وق a JU‏ نظام النقل ف 944« فإن استخدام بطاقات أويستر (Oyster)‏ يعني أنه من 
اممكن تتبع الرحلات الفردية عبر نظام الحافلات والسكك الحديدية اللمستخدمة من قبل 
scala‏ راكب يوميا )2012 (Batty et al.‏ وبالمثلء من اممكن الآن المراقبة التلقائية 
لأشكال متنوعة من الخدمات العامة المقدمة التى كان يجري رصدها عرضاء مثل جمع 
النفايات» من خلال استخدام رقائق تحديد الهوية باستخدام موجات الراديو (RFID)‏ التي 
تثبّت على حاويات النفايات ويتم مسحها عن بعد عند نقاط الجمع. وأصبح من ال ممكن 
قياس كميات التخلص من النفايات باستخدام مقاييس مرفقه بمجموعة مركبات وتحميل 
الأسر بصورة فردية تكلفة التخلص من النفايات على أساس الحجم بدلا من الرسم 35-9 
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ذون تمييز. كما أضبح من الممكن أيضا الحصول على فهم مفصّل لأماط التخلص من 
النفايات داخل منطقة ما وإعادة تخطيط طرق وأوقات الجمع. 


الأجهزة الرقمية :(Digital Devices)‏ 
كما سبق الإشارة al‏ كان هناك نمو هائل في عدد الأجهزة الرقمية ا مستخدمة حول 
العام والتي تساعد على «agas‏ وتعزيزء وإدارة العديد من جوانب الحياة اليومية. فهذه 
الأجهزة لا تقوم مجرد معالجة البيانات الرقمية والتعليمات فحسب» ولكنها تنتج بيانات 
رقمية بشكل نشط وكوظيفة أساسية لها أو ثانوية» أو الاثنين على حد سواء. ومن الأمثلة على 
الأجهزة التي تنتج بيانات رقمية كوظيفة أساسية: الكاميرات» وأشرطة الفيديوء والمراقيب 
ووحدات تحديذ المواقع (GPS)‏ وأشكال مختلفة من المعدات الطبية مثل كاميرات المنظارء 
والماسحات بالموجات فوق الصوتيةء وموازين الحرارة iss JI‏ إلخ. أما أمثلة الأجهزة التي 
تنتج بيانات رقمية كوظيفة ثانوية» فتشمل الهواتف النقالة ومستقبلات البث التلفزيوني 
عبر الكابل أو الأقمار الصناعية» والتي تنتج بيانات متعلقة بكيفية استخدامها Ae)‏ 
سبيل JULI‏ الوقت» ال مكان. الشخص امتصل / القناة ا لمشاهدة). مع البيانات المتصلة 
بها والتي جرى جمعها في سجلات يتم إرسالها إلى أطراف ثالثة (مثل مصنعي الأجهزة 
ومقدمي الخدمات). أما الأمثلة على الأجهزة التي تنتج البيانات الأساسية والثانوية معا 
فتشمل الهواتف الذكية التي يمكن استخدامها لتسجيل ا ملاحظاتء والتقاط الصورء وكتابة 
البريد الإلكتروني والتعليقات على وسائل التواصل الاجتماعيء «aul...‏ بالإضافة إلى تسجيل 
استخدام مختلف التطبيقات. وتشكل هذه الأجهزة سلالة جديدة من has SLI‏ 
لوجكتس )2011 (Logjects) (Kitchin and Dodge‏ - کائنات ترصد وتتبع تاريخ 
استخدامها الخاص. وق كتير من الحالات» يكون من ال ممكن تسجيل موقع هذه الأجهزة. 
فالهاتف الجوال والهواتف الذكية مكن تتبعها من الفضاء عن طريق التثليث (حساب 
المثلثات) عبر هوائيات الهاتفء وأيضا عن طريق مستقبلات تحديد المواقع المدمجة فيهاء 
بالإضافة إلى مراقبة السرعة والاتجاه من خلال امدوار (Gyroscopes)‏ ومقاييس التسارع 
(Accelerometers)‏ والىوصلات Ki JS —5 Ae (Compasses)‏ اص أسطوانية. أو أحهزة 
ملاحة بالأقمار الصناعية أو أي أجهزة أخرى. وعلاوة على ذلك» فإن العديد من هذه 
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الأجهزة يمكن أن تتفاعل بشكل مستقل بعضها مع بعض وتقوم بتبادل البيانات. ومع تكاثر 
الأجهزة المعقدة لكافة المهام وف كل الأماكنء يتم إنتاج المزيد والمزيد من البيانات الغنية 
بالبيانات الوضفية القابلة للفهرسة:. مما يتيح تحليلا أكثر تظورا واستحداث إستراتيجيات 
ومنتجات جديدة قائمة على السانات. 


السانات المستشعرة :(Sensed Data)‏ 
تعد المستشعرات والمحركات من أنواع الأجهزة الرقمية. وهي ما oS‏ أن تكون ضمنا 
أو جزءا من هياكل مختلفة لقياس مخرجات معينة مثل مستويات الضوء» والرطوبة» ودرجة 
الحرارةء والغاز والمواد الكمياشية» والمقاومة الكهربائيةء والصوتيات. وضغط الهواء والحركة 
والسرعة. ...إلخ. وتعد أجهزة الاستشعار والمحركات صغيرةء وغير مكلفة فى العموم» ويمكنها 
إنتاج تيار مستمر من البيانات» ويمكن أن تكون سلبية وتقرئ بواسطة الماسحات الضوئية. 
أو Sce‏ أن اتون فط بحت تلق البيانات Coli ue‏ منعظامة SC e‏ الحاسسب 
ا لمحلية أو الواسعة: أو قد يكون لديها 8538 الاتصال من خلال حقل الاتصالات القريب 
(NFC)‏ والذي يتيح الاتصالات ق اتجاهين )2013 .(Hancke et al.‏ وبوضعها على u>‏ 
مكن للمستشعرات أن تقيس وتتواصل لحساب معدلات التآكل (عن طريق قياس المقاومة 
الكهربائية) ومقدار الضغط على مواد البناء باستخدام أجهزة استشعار الانبعاثات الصوتية 
(للكشف عن انتشار ال موجات الصوتية) وأجهزة استشعار التخصّر ا مغناطيسي (للكشف عن 
تغيرات في الحث ال مغناطيسي). ومن ثم يقلل ذلك من الحاجة إلى التفتيش اليدوي ال مكلف 
.(Hancke et al. 2013)‏ وبا مثلء مكن للمستشعرات داخل نظام امياه قياس نوعية 
oL]‏ وضغطهاء ومقدار تدفقهاء وتمكين الإدارة الآنية وصيانة الأنابيب لحظة بلحظة. deg‏ 
ا مركبات» مكن للمستشعرات رصد حجم العملء والإجهاد. والتضاريس. فشركة هيتاثي 
تستخدم هذه ال مجسات لرصد مركباتها الثقيلة المعقدة والمكلفة. وكذلك تفعل s oJ]‏ نفسه 
شركة النقل السريع (UPS)‏ مع أسطولها من عربات النقل والشاحنات بحيث توظفها 
لتشغيل خدماتها بكفاءة وبصورة استاقية Plumridge 2012; Mayer-Schonberger)‏ 
(and Cukier 2013‏ ومن خلال ربط رقائق تحديد الهويه باستخدام موجات الراديو 
(RFID)‏ بال منتجات أصبح من الممكن رصد وتتبع حركة الوحدات الفردية من المصنع 
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أو المزرعة إلى المستهلكء والحذ من السرقة والهدر. وباممثل» تحتوي بطاقة الضريبة على 
شريحة تحديد الهوية باستخدام موجات الراديو التي تتواصل مع قارئ ترددات راديوي 
على حواجز تحصيل الرسوم» مما يؤدي إلى سرعة أعلى في حركة المركبات والدفع JII‏ 
بالاضافة إلى حساب معدل حركة OLS AI‏ او عدد مواقف السبارات المتاحة لإدارة حركة 
المرور. كما تثبت رقائق تحديد الهوية باستخدام موجات الراديو على الحافلات والقطارات 
والتي تتواصل مع قارئ الموجات الراديوية على طول مساراتها مما يجعل من Lall‏ تتبع 
موقع ال مركبات $ أي Ll dho‏ 

كما يمكن إنشاء شبكة استشعار كثيفة من خلال توزيع العديد من أجهزة الاستشعار 
وربط البيانات التي تنتجهاء مما يتيح رصد أوضاع مختلفة عبر نظام أو مكان ما. وقد 
توالت الأمثلة على هذه الشسكات وأجهزة الاستشعار في مدينة سانتاندر (Santander)‏ في 
إسبانيا كجزء من مشروع امدينة الذكبية .(SmartSantander)‏ وفبه 12000 من أجهزة 
الاستشعارء وتتكون من خمسة آنواع» تم توزيعها بشكل إستراتيجي في جميع أنحاء المدينة 
لقياس الضوضاءء والحرارة» ومستويات الإضاءة ا محيطة: وتركيز SJl 0-5105 A‏ 92« 
والأماكن المتوافرة لوقوف السيارات وركنها )2013 (Bielsa‏ وترتبط أجهزة الاستشعار معا 
من خلال الاتصالات اللاسلكية وتوظيف البرمجة عبر الأثير (OTAP)‏ مما يمكن من برمجتها 
وتحديث برمجياتها عن بعد )2013 816153). كما يجري تطوير وادي بلان اي تي (PlanIT)‏ 
في البرتغالء وهو في الوقت الحاضر تحت الإنشاء ومصمّم لإيواء 225 آلف نسمةء ويهدف 
إلى إنشاء بيئة قائمة على أكثر من 100 مليون جهاز استشعار مدمج فيها والتى سوف تنتج 
سانات لرصد مجموعة degu‏ من البنى duol‏ والستات )2012 .(Marchetti‏ وهكذاء 
تنظر إل Col iia‏ وضقها هنما Lu]‏ في التطورات التي تشهدها المدينة الذكية. 


بيانات المسح الضوتي (Scan Data)‏ 

بالاضافة إلى الأجهزة الرقمية وأجهزة الاستشعار التي تنتج البيانات بشكل نشط والتي 
هي sym‏ من شبكة إنترنت الأشياء: من ال ممكن رصد وتتبع الكائنات $521 "t‏ من خلال 
;592 الهوية المقروءة ui‏ وقد تجاوز استخدام الرمز الشريطي (Barcode)‏ قطاع البيع 
بالتجزئة ليشمل السلع ال مصنعة والاستمارات الرسمية» كما وضعت العديد من ال منظمات 
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الكبرى والقطاعات الصناعية نموذجها الخاص من الرمز الشريطي ومعاييرها لتخصيص 
الأرقام )2005 JE gs (Dodge and Kitchin‏ السانات à‏ الرموز الشريطية LSLS‏ الأبعاد 
LA‏ ورام ےا مجموعة هخ التفاظ المرقطة وکن اش تغدامها لتجدىد oils‏ تکل قريد: 
وتستخدم بعض خدمات البريد هذه الرموز الشريطية الثنائية الأبعاد لتمكين المتابعة 
والتعقيب للرسائل والطرود البريدية بشكل فردي. وبامثل» تحتوي الشرائط ا مغناطيسية 
المشبتة على بطاقات الائتمان والولاء وبطاقات السماح بالعبور من خلال الأبواب على معرّف 
فريد يختص بصاحب البطاقة التي يتم قراءتها عند تمريرها على القارئ. وقد جرى استبدالها 
لاحقا برقائق إلكترونية مكن التحقق من البيانات التفصيلية فيها باستخدام الأرقام السرية 
الشخصية لمستخدميها. كما يتم إنتاج البيانات الخاصة بالاستعمالء في كل مرة يجري فيها 
مسح الرمز الشريطي أو الشريط المغناطيسي أو الرقاقة الإلكترونيةء متضمنا ذلك أين ومتى تم 
الاستخدام ولأي غرض. وبالنظر إلى أن الغرض من هذا المسح ف كثير من الحالات هو لشراء 
السلع» فهي توفر وسائل مهمة لإنتاج معلومات عالية الدقة والتفصيل للضفقات Asl‏ 


السيانات التفاعلية :(Interaction Data)‏ 
على الرغم من أن بعض مستخدمي الإنترنت ينظرون إليها باعتبارها وسطا مجهول 
bleki‏ إلى حذ ماء إلا أن كل تفاعلات المستخدفين الجارية عبر شبكات ال معلومات والاتصالات 
تنتج بيانات تفاعلية. وحقيقة: فإن cel‏ البيانات هو قائم بطبيعته على العديد من أشكال 
الاتصال والاستخدام في شبكات تقنية المعلومات والاتصالات. على سبيل «JUL‏ يتعقب 
مزودو خدمات الإنترنت امواقع التى تتصل بها حسابات المستخدمين الفردية والأجهزة: 
وتستخدم العديد من المواقع» وخاصة مواقع الشركات» سجل التتبع وتعريف الارتباط 
للمتصفح (كوكيز (Cookies‏ لإنتاج بيانات النقر (اختيارات المستخدم). gi‏ كيفية تنقل 
eade‏ خلال الموقع على شبكة الإنترنت وما الميزات التي جرى اختيارها. وبشكل عام 
تستخدم مثل هذه البيانات لمراقبة LAS‏ أداء الموقع الإلكتروني؛ وإجراء أبحاث عن السوق 
ziig‏ مسار إنتاجية الموظف. مع إمكانية بيع هذه البيانات إلى أطراف أخرى. 29& 
إنشاء بيانات النقر هذه بصورة تلقائية ما لم يعد المستخدم تطبيق المتصفح لعدم قبول 
ملفات تعريف الارتباط (وهذا قد يضعف استخدام الموقع). وبامثل» يتم تخصيص رموز 
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تعريفية فريدة في جميع الصفقات امالية القائمة على تكنولوجيا المعلومات والاتصالات. 
سواء الخد هات اللقرفية الشخضية O ETEA‏ عمانات سحب أموال من أجيزة الضراف 
«JS‏ أو عمليات المتاجرة في الأسهم» ويجري تخزين بيانات هذه المعاملات تباعا. وتحتوي 
جميع رسائل البريد الإلكتروني على رؤوس في مقدمة حزم بياناتها والتى تقوم بتحديد البريد 
الإلكتروني بشكل فريد» وتحتوي على معلومات تشمل المرسل واممتلقي» والخوادم والأجهزة 
المستخدمة. وعلى المنوال نفسه. يتم تمييز جميع ا مكالمات الهاتفية بمعلومات المتلقى 
ÄLL‏ ووقت إجرائها ومدة بقائهاء وما إذا كان الهاتف محمولا واموقع. daig‏ لذلك 
يتم إنشاء كميات هائلة من البيانات بشكل روتيني بشأن التفاعلات الحاصلة عبر شبكات 
تكنولوجيا المعلومات والاتصالات. 


البيانات التطوعية :(Volunteered Data)‏ 
على النقيض من المراقبة الموجهة إلى الأشخاص أو الأشياء من قبل الأفراد «als‏ 
أو تلك التي يتم التقاطها تلقائيا باعتبازها ميزة متأضلة لجهاز أو نظام ماء فإن كثيرا 
من البيانات الكبيرة يتم إنتاجها من قبل الناس بشكل تطوعي فعّال. ففي مثل هذه 
الحالات» ينتج الأفراد البيانات ويقومون بإدخالها للعمل على الاستفادة من خدمة 
(مثل وسائل التواصل الاجتماعي)ء أو المشاركة في مشروع جماعي مثل مشروع خريطة 
الشارع المفتوح 9l (http://www.openstreetmap.org)‏ موسوعة الانترنت ويكسيديا 
Jdi (299 .(https://www.wikipedia.org)‏ هذا العمل بالإنتاج الاجتماعي 
(Prosumption)‏ حیث تختلط bli‏ الإنتاج والاستهلاك حزتيا بعضها ق بعض» 
مع اكتساب الأفراذ has‏ ق إنتاج الخدمة أو ex‏ الذي يستهلكونه Ritzer and)‏ 
.(Jurgenson 2010‏ فعلى سبيل «JUL‏ يجري إنتاج واستهلاك محتوى مواقع التواصل 
الاجتماعي في ذات الوقت من قبل الأفراد المستخدمين عن طريق إدخال التعليقات. 
تحميل الصور ومقاطع الفيديوء وا لمشاركة في مناقشة وتبادل ال مشاعر («الإعجاب» 
أو «عدم الإعجاب» للشيء). ومن خلال جهودهم الجماعيةء ينشئ الأفراد المنتجات 
والخدمات التي يشاركون فيها ويضيفون قيمة لها ويستخرجون القيمة منهاء بحسب ما 
أشار إليه )2006( Benkler‏ بمصطلح «ثروة الشبكات». وفي معظم الأحوال؛ يقوم أفراد 





E897 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الخامس 


الإنتاج الاجتماعي بهذا العمل الإضافي بمقابل مادي قليل أو دون أي تعويضء وذلك إما 
للحصول على متعة المهمة» أو الشعور بالسلطة: أو توفيرهم JU.‏ والوقت مع انخفاض 
تكلفة الخدمة والتي غالباً ما تصبح أكثر مرونة بطبيعتها مثل الخدمات المصرفية عبر 
الإنترنت أو الحجز في رحلة طيران من المنزل. ف المقابلء يتلقى مزود الخدمة أو متاجر 
التجزقة عملا دون تكلفة: نالإضافة إلى الخرات والآراء والمعرفة واكتساب الكفاءة 
ومعلومات ذات قيمة من خلال القرب أكثر من العملاء / الزبائن والقدرة على تسسل 
بياناتهم )2013 .(Ritzer and Jurgenson 2010; Dodge and Kitchin‏ فیعض أشكال 
الإنتاج الاجتماعي هي أقرب إلى الخدمة الذاتية ومقيدّة بطبيعتهاء مع قيام أفرادها بالأعمال 
التي كانت مسندة إلى موظفينء في حين أن البعض الآخر أكثر انفتاحا وتفاعلية. Lag‏ 
سيتم مناقشة خمسة أشكال للسانات التطوعية باختصار: اماملا (Transactions)‏ 
ووسائل التواصل الاجتماعي (Social Media)‏ وامراققة الحبة (Sousveillance)‏ 
والتعهيد الجماعي (Crowdsourcing)‏ وعلم المواطنة (Citizen Science)‏ 


المعاملات (Transactions)‏ 
يتطلب الشراء عن طريق الإنترنت من المشتري إدخال البيانات الشخصية له فيما يخض 
عملية الدفع والعنوان وغيرها من البيانات الوصفية الضرورية الأخرى باعتبارها جزئيا 
عملية للتحقق وتبادل المعلومات ولكن أيضا لمعرفة المزيد عن المستهلك. وعادة ما تكون 
التفاعلات في مثل هذه التبادلات محدودة إلى حد ماء وتقتصر على اختيار ماهية بنود 
الشراءء والعديد من حقول البيانات الإلزامية لوضع اللمسات الأخيرة allg‏ عملية الشراء. 
وبعد تبادل اممعلومات» من ال ممكن طلب امزيد من المعلومات من المستخدمينء إما لتقييم 
أداء الموقع وخدمة العملاءء أو لتصنيف ومراجعة بيانات البند الذي تم شراؤه. وتضيف 
بيانات ال مراجعة هذه قيمة للموقع من خلال اقتراح كيفيه تحسين التصميم وكذلك تزود 
ا مستهلكين الآخرين بردود الأفعال (Feedbacks)‏ عن مدى جودة وكفاءة ال منتجات. فعلى 
مواقع الكترونية مثل «(http://www.tripadvisor.com)‏ مكن ÀY‏ اد الإنتاج المجتمعي 
تقييم واستعراض الفنادق وخدمات السفر الأخرىء مثل البيانات التي يجري تقدهها طوعا 
على الموقع عن حركة المرورء وبث الإعلانات والإشارة إلى مواطن الربح المحتملةء مما يكون 
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له تأثير ملحوظ في اختيارات المسافرين الآخرين. كما يوفر الموقع بيانات مفيدة حول 
الشخص الذي تطوّع لإجراء الاستعراض والتقييم» مثل خيارات أسلوب الحياة والإنفاق 
خلال السفر التي يمكن تسييلها ماليا عن طريق بيعها إلى أطراف ثالثة. وبالمثل. تتطلب 
تعبئة النماذج الإلكترونية الحكومية من المواطن تقديم معلومات للموقع بشكل تطوعي. 
وهناء يكون هنالك تبادل للبيانات يتعدى حدود عملية الدفع للمبالغ النقديةء فبعض 
البيانات الإضافية الأخرى يمكن أن تكون مرتبطة بالمعاملات. مثل بيانات مسار النقر على 
الصفحات ومعلومات بطاقة الولاءء مما يتيح clo‏ ملف مبدني للشخص هكن البناء عليه مع 
مرور الزمن أو يتم ربطه مع مصادر البيانات الأخرى مثل بيانات التوزيع الجغرافي للسكان. 


التواصل الاجتماعي (Social Media)‏ 
قبل العام eY‏ كانت شبكة الإنترنت إلى Xo‏ كبير وسطا É‏ الإغلامئ يمكن من 
خلالها للناس تقديم المعلومات أو شراء البضائع. وكانت هناك لوحات الإعلانات والقوائم 
البريدية التي يستطيع الناس من خلالها التواصل» ولكنها كانت قائمة على استخدام النصوص 
فقطء ومحددة بطريقة عرض بدلا من كونها dl. Lug‏ مفتوحة وعامة. وبينما هكن للأفراد 
إنتاج أشكال أخرى من ال محتوى مثل صفحات الويب» إلا أن ذلك يتطلب المهارة لإنشاء 
مثل هذه الصفحات وشراء اسم النطاق. وكانت هذه الصفحات ثابتة إلى حد كبير وينبغي 
تحريرها بشكل رئيسي على الطريقة اليدوية ليجري تحديثها. واعتبارا من العام ۲٠١١‏ 
وعلى الرغم من eUS‏ بدأت طبيعة شبكة الإنترنت بالتغيّر لتصبح أكثر تفاعلية وتشاركية 
ودينامية» وقد تم الإشارة إلى هذا التحول على أنه الانتقال من إصدار شبكة الويب الأول 

(Web 1.0)‏ إلى الإصدار الثانى )2005 (Web 2.0) (O'Reilly‏ . 
وعوضا عن محتوى الويب الذي يجري تقدهه إلى حد كبير من قبل ا مختصين ومصممي 
المواقع الإلكترونيةء فقد أصبح لآي شخص إمكانية إنشاء محتوى يمكن تحديثه بشكل 
مستمر. وعلاوة على eUS‏ مكن الوصول إلى هذا ا محتوى والتفاعل معه من خلال 
مجموعة متنوعة من المنصات مثل الهواتف الذكية والأجهزة اللوحية. "T‏ من مجرد 
تصفح المعلومات أو تقييدها في مناقشات ضيقة نسبياء أصبح من الممكن للناس المشاركة 
بسهولة وبشكل فعال في إنتاج عام الإنترنت وتصميم وتحرير المحتوىء والإسهام بحرية في 
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الخدمات التي تتبادل ال مواد مع الآخرين. وفي حين تم اعتبار الإصدار الأول لشبكة الويب 
Us Lus (Web 1.0)‏ للقراءة «da‏ فإن الإصدار الثاني لشبكة الويب )2.0 (Web‏ هو وسط 
للقراءة والكتابةء يمكن للناس من خلاله إضافة قيمة للمواقع عندما يقومون باستخدامها. 

وتميل مواقع الإصدار الثاني من الويب وخدماتها إلى التركيز على النشر من العديد - 
إلى - العديد. والتواصل الاجتماعيء وتوفير معلومات أكثر ثراء واتساقا. وتشتمل الأمثلة 
على خدمات الشبكات الاجتماعيه على سبيل JLI‏ الفيسبوك وتويتر؛ والصور ومواقع 
مشاركة الفيديو على سبيل المثال. فليكر ويوتيوب؛ والمدونات؟ وعمليات المزج باستخدام 
واجهات برمجة التطبيقات المفتوحة (APIs)‏ لدمج البيانات من مصادر مختلفة لإنشاء 
تطبيقات جديدة على سبيل JUL‏ فورسكويرء وييلب (Yelp)‏ وتعتمد هذه امواقع كلها 
على المشاركة الفعالة من جمهور متحمس لتبادل المعلومات حول حياتهم والقيام بأعمال 
من قبيل الكتآبة)التحريرء التظبيق» التعديلء النشرء المشاركة: الوسظة» التواصل, ... إلخ 
(Beer and Burrows 2007)‏ وعند القيام بذلك» فهم لا يتطوعون بالعمل فقطء ولكن 
بالكثيز من البيانات عن «ea ail‏ متضمنا ذلك الملفات التعريفية, الصور, المواقت» الآراء 
التفضيلات. القيم» وشبكة اتصالاتهم الاجتماعية. ولآنه قد جرى تملك هذه المواقع من 
قبل مجموعة شركات تأسست dao‏ فإنه يجري تداول البيانات في أيدي مملوكة للقطاع 
الخاص والتي تسعى بدورها لإنتاج نماذج جديدة من تراكم رأس ال مال عن طريق استخراج 
القيمة منها (انظر الفصلين الثاني والسابع). 


المراقبة الذاتية :(Sousveillance)‏ 

المراقبه الحيه هى الرصد الذاتي وإدارة صحه الفرد الشخصية وحياته من خلال التقنيات 
الرقمية الحميمة على سيل «JULI‏ معدات ASLI‏ البدنية. والحوسمة القابلة للارتداء 
لتسجيل السانات المتعلقة بالفرد )2003 .(Mann et al.‏ وعلى النقيض من المراقة 
الإشرافية (Surveillance)‏ والتي يتم فيها مراقبة الفرد من موقع خارجي بواسطة شخص 
اخرء يجري توظيف وضبط الراقبة الذاتية عن وعي وإدراك الفرد لتحقيق الذات» وتوفير 
منظور Jsl dil»‏ عن حياته. (Jes‏ مدى العقد الماضيء تطورت حركة المراقبة الذاتيه من 
أناس يراقبون ويسجّلون بنشاط بياناتهم الشخصية والتي تُعرف أيضا باسم حركة القياس 
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"s‏ للذات أو التتبع الذاني (Quantified Self) ba‏ وبشكل ele‏ براقب الآفراد جوانب 
الصحة واللياقة البدنية» ويجمعون سانات الاستهلاك (على سبل «JULI‏ المواد الغذائية / 
السعرات الحرارية)ء والحالات الجسدية (مثل ضغط الدم والنبض)ء والحالات العاطفية 
(على سبيل المثالء المزاج ومستويات الإثارة) والآداء (على سبيل JELI‏ أميال المشي/ الركض 
/ الدوران المقطوعة. وعدد ساعات النوم» وأنواع النوم)» بالتعاون مع عدد من الشركات 
التي eaa‏ التقنيات والخدمات ال مرتبطة بالمراقبة الذاتية. وتشمل شركات مراقبة الأنشطة 
الرياضية والنوم» على سبيل المثالء شركات من أمثال فت بت» ونايك بلس» فيول «3b‏ 
وجوبون (Fitbit, Nike+, Fuelband, and Jawbone)‏ والتی تعمل على مزامنه البيانات 
الناتجة مع تطبيقات متابعة وتعقب تسمح للمستخدم برصد وتحليل بياناته الشخصية. 
ولا يجري بالضرورة مشاركة البيانات التي تم إنتاجها على نطاق أوسع: على الرغم من 
إمكانية حدوث ذلك ولكن يجري مشاركتها مع الشركات ال مزؤدة للخدمة: مما يوفر لهم 
اطاذعا e‏ اانا التخصة 

وعد هذه التقنيات في ا مرحلة الأولى من التطوير وهناك رؤى أكثر شمولا لتسجيل 
بيانات الحماة (Life Logging)‏ التي تعمل على إنشاء سجل رقمي موحّد لخرات الأفراد. 
من خلال جمع متعدد الطرق عبر أجهزة استشعار رقمية» وتخزينها بشكل دائم كأرشيف 
شخصي متعدد الوسائط )2003 (Mann et al.‏ وذلك مع عدد من نماذج الأبحاث التى 
يجري تطويرها حاليا. وتهدف سجلات بيانات الحياة إلى إنشاء سجل متصلء وقابل للبحث 
والتحليل لماضي الشخص الذي يشمل JS‏ عمل» أو كل حدث» أو كل محادثة» أو كل 
موقع تمت زيارته» أو أي تعبير مادي متصّل بحياة الفرد. فضلا عن الظروف الفزيولوجية 
داخل الجسم والأوضاع الخارجية المحيطة به (على سبيل JELI‏ الؤجهة. ودرجة الحرارة 
ومستويات التلوث) C - (Dodge and Kitchin 2007b)‏ مجمل المعلومات التي تتدفق 
خلال eU»‏ الإنسان (85 :2003 .(Johnson‏ ومن الواضح أن etu‏ هذه السجلات عن 
الحياة يثير عددا من الأسئلة بشأن الخصوصية: وملكية البيانات المنتجة. وطريقة استخدام 
هذه السانات (Dodge and Kitchin 2007b)‏ 
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التعهيد الجماعي :(Crowdsourcing)‏ 

التعهيد الجماعي هو الإنتاج المشترك لوسائط الإعلام: والأفكارء والبيانات من خلال العمل 
التطوعي من قبل العديد من الناس لحل مهمة معينة. وبينما يمكن القول بأن محتوى وسائل 
التواصل الاجتماعي هي نتاج تعهيد جماعي بمعنى أنه يتم الحصول عليه من قبل عدد كبير 
من الناسء إلا أن الغرض من هذه المحتوى مورّع وواسع الانتشار ويفتقر إلى التركيز. فبدلا 
من ذلك» يركز التعهيد الجماعي على الإنتاج التعاوني للمعلومات وإنشاء حلول لقضايا معينة 
من خلال الاعتماد على الطاقة؛ وا معارف. «bles‏ والعمل التوافقى والجماعي لحشد من 
الناس )2008 (Howe‏ وقد بين )2008( Howe‏ أن هناك أربعة تطورات تدعم نمو التعهيد 
الجماعي: نهضة الهواة (بحسب المعايير ا مهنية في الغالب). وظهور حركة البرمجيات مفتوحة 
المصدرء وزيادة وفرة أدوات الإنتاج خارج إطار الشركات «Axial‏ وصعود مجتمعات محلية 
حيوية ومنظمة وفقا لاهتمامات الناس وميولهم على شبكة الإنترنت» فهذه التطورات 
مجتمعة مكنت من تجميع موزع وديمقراطي للأفكار والأدوات والمواد. وهناك ثلاثة أنواع 
رئيسنية من التعهيد الْجَمَاع التي تعمل في الوقت الحاضر: تلك التي تنتج حلا بشكل 
جماعي على سبيل JELI‏ خريطة الشارع المفتوح (http://www.openstreetmap.org)‏ 
ويكيبيديا t(https://www.wikipedia.org)‏ وتلك التي تستخدم الجمهور لتقييم حلول أو 
منتجات متعددة على سبيل «JULI‏ موقع شركة أمازون (https://www.amazon.com)‏ 
ومستشار الرحلات ‘(https://www.tripadvisor.com)‏ وتلك التی تسعى إلى حل واحد 
أو أكثر من الجمهور على سسل JELI‏ إنوسنتف (/https://www.innocentive.com)‏ 
واملتقيات المكثفة مطورى البرمجيات (Hackathons)‏ 


وبخصوص النوع الأول» أصبح إنتاج المعلومات (خريطة مفتوحة المصدرء موسوعة قابلة 
للتعديل والوصول إليها بحرّية ) تعاونياء وعملا من إنتاج الأفراد. مع إعطاء المشاركين 
الحقوق والتسهيلات لتعديل وتنقيح وإسهاب الشرح لمساهمات 55,21 Benkler)‏ 
6).. فمن خلال العمل عبر شبكة الإنترنت مكن لأى أحد له قدرة النفاذ إليها من أن 
يسهم ويضيف إلى مجمّع الخبرات المحتملة ونطاق المشاريع مقابل تكلفة آقل» وضمان 
ممارسة مختلف وجهات النظر والتقنيات على المشروع )2011 .(Weinberger‏ وف الواقع, 
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فإن إنتاج خريطة مفصّلة للعامم أو موسوعة شاملة مع عدد قليل من المهنيين هي مهمة 
صعبة ومكلفة» وببساطة شاقة للغايه بالنسبة لمجموعات صغيرة من المتطوعين. ولكن 
بالنظر إلى آلاف اممشاركينء يمكن تجزئة المهمة عليهم وحلها. وسيكون LALI‏ الذي سيجنيه 
المشاركون هو إنتاج بيانات مفتوحة المصدر خالية من حقوق الطبع والنشر والرخص 
المكلفة LS)‏ هو الحال مع بيانات الوكالة الوطنية لرسم الخرائط) Dodge and Kitchin)‏ 
73). وبالمثلء يمكن لشركة أمازون وغيرها من شركات التجزئة على الإنترنت. من خلال 
S‏ المستخدمين من استعراض امنتجات التي يشترونهاء استخدام قوة الجماهير مراجعة 
ومشاركة آرائهم حول هذه المنتجات. كما أن الفائدة التي تعود على المشاركين هي تبادل 
الرأي فيما يتعلق بالمزايا النسبية للسلع والخدمات. 

ويعد استخدام المسابقات لتحفيز الجماهير على اقتراح حلول مقابل جائزة من أشكال 
التعهيد الجماعي الخاصة والذي تستخدمه بعض الشركات لتقديم الخبرات والأفكار 
.(Weinberger 2011)‏ فعوضا عن اللجوء للمناقصات والاستعانة مجموعة محدودة من 
الخبراء المحتملين» تفتح شركات مثل إنوسنتف (Innocentive)‏ وتوب كودر (TopCoder)‏ 
المQشكلة‏ من خلال الإعلان عنها لأى شخص مهتم» وتقدم à‏ العادة من عشرة الاف إلى مئة 
ألف دولارء وأحيانا أكثر من ذلك بكثيرء لإيجاد حلول ممشاكل العملاء. وهناء يكون الجمهور 
هو مصدر الحلء ولكن لا يعمل الأفراد بعضهم مع بعض بشكل جماعيء وتكون الفائدة 
بالنسبة للشركات هي خيازات الحل المقدمة وللمشاركين هي العائد ال مالي ]18 e3‏ اختيار 
الحل الخاص بأحدهم. وعلى نحو مماثل» تسعى مسابقات بيانات التطبيقات المفتوحة 
التي تعقدها المجالس البلدية إلى تقديم مكافآت أكثر تواضعا مقابل تطبيقات أكثر فائدة 
وإثارة للاهتمام. ويمكن eda)‏ المسابقات أن تأخذ شكل ال ملتقيات المكثفة للمطوري البرمجيات 
(Hackathons)‏ التي يعمل الناس فيها معا في فرق لتطوير حلول تطبيقات» وعادة ما 
تمتد على مدى يوم أو خلال عطلة نهاية الأسبوع. وتتمثل الفائدة العائدة على البلدية في 
استخدام بياناتها من أجل الصالح العام» وشهرة ا مواطنين: والمشاركة المدنية. 


859 البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها wv‏ 
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(Citizen Science) المواطنة‎ ele 
المواطنة هو شكل من أشكال التعهيد الجماعي حيث تعمل مجتمعات أو شبكات‎ ele 
هناء‎ .(Goodchild 2007: 218) مراقبين في بعض مجالات العلوم‎ dia من امواطنين‎ 
يقوم الناس بإنتاج وإعداد ومعالجة الملاحظات العملية التجريبية: والقياسات التفصيلية‎ 
للظواهر بالمجانء والتي تُعدء حاسمة ومفصليةء وذات قيمة حقيقية كنقاط بيانات للعلوة‎ 
من حيث الرصد لأنهم قد‎ gel الصحيحة. ويكون علماء ال مواطنة ذوي فائدة بشكل‎ 
يكونون موزعين جغرافیا ومُدرجین ضمنا في المكان عبر الزمن حيث من الصعب على‎ 
مستويي التنسيق والتكلفة استخدام مساعدي البحوث المهنيين لجمع القياسات اميدانية.‎ 
ومن الأمثلة على ذلك. قياسات هواة الرصد الجوي الناتجة من محطات الحدائق الخلفية‎ 
الفلك الذين يراقبون السماء ليلا بدقة. وقد أصبح علم المواطنة‎ ele للأرصاد الجوية» وهواة‎ 
النشاط ضشلا‎ Jl» لرواج العلم وتعميمه»ء ولكن لا‎ TR خلال القرن العشرينء. وذلك‎ lai 
$3 ويعتمد على درجة معقولة من المهارات وا معارف والمعدات المتخصصة مثل مرقاب‎ 

نوعية جيدة. وفوق ذلك قدر كبير من التحفيز والالتزام المستمرين. 

وقد .(Bonney et al 2009; cited in Miller-Rushing et al. 2012) iio‏ أشكال 

ele‏ المواطنة في ثلاث فئثات: 

e‏ التساهمية (Contributory)‏ وتصمم بشكل ele‏ من قبل العلماء ولأجلها بسهم الأفراد 
äle‏ بالبيانات في المقام الأول. 

o‏ التعاونية :(Collaborative)‏ وتصمم بشكل ele‏ من قبل العلماء ولأجلها بسهم الأفراد 
dale‏ بالبيانات» ولكن قد يساعدون أيضاً على تحسين تصميم المشروع: وتحليل OBLI‏ 
ونشر النتائج. 

o‏ الإنشاء ا مشترك :(Co-created)‏ وتصمم من قبل العلماء وأعضاء من عامة الجمهور 
يعملون معا ولأجلها ex‏ إشراك بعض عامة المشاركين على الأقل ف معظم أو جميع 
colla‏ العملية Lj &US Js cia tias]‏ البحوث التي وضع تصورها وتم تنفيذها 
من قبل علماء هواة (غير مهنيين) بشكل Ja‏ 
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às‏ العادة يختلف مسنوی الخيرة ونوع امشاركه بحسنا الفئةء مع مشاركه اطواطنين 

العلماء فقط من ذوي المهارات الأكثر تقدما في مشاريع الإنشاء المشترك. ويمكن أن تتخذ 

المشاركة عددا من الأشكالء Le‏ في ذلك: 

o‏ الحوسبة الموزعة: حيث يضيف أحد المشاركين قوة معالجة حاسوبية من أجهزة الحاسس 

«JULI النسخ / التحويل / الرقمنة: تحويل شكل من أشكال البيانات إلى آخرء على سبيل‎ o 
تحويل وثائق مكتوبة بخط اليد إلى نص رقمي (التساهمية).‎ 

٠‏ قياسات الرصد: ينتج العلماء البيانات» ولكن يستخدم ele‏ المواطنة لإجراء القياسات 
باستخدام أدوات محددة يجري توريدها لهم (التساهمية). 

* جمع السانات: ge‏ أفراد اطمواطنين السانات ومن ثم يقومون ممشاركتها مع العلماء 
(التساهمية). 

٠‏ تحليل الرصد: يقوم أفراد المواطنين بإجراء بعض التحليلء Le‏ في ذلك توفير بعض التفسيرات 
لما قد تعنيه النتائج» بدلا من مجرد الاكتفاء بإنتاج أو قياس البيانات (التعاونية). 

٠‏ تصميم البحث وتشغيله: يقوم أفراد المواطنين بدور نشط في تصميم وتشغيل المشروع 
فضلا عن نشر النتائج والاستنتاجات (الإنشاء المشترك). 


(Open Scientist 2013) 


الخلاصة: 

تطرّق هذا الفصل إلى العوامل المساعدة للبيانات الكبيرة ومصادرها. وتم بيان أن إنتاج 
البيانات الكبيرة قد تبسر بفضل التقاء خمسة ابتكارات تقنية من بداية LAYI‏ الجديدة 
فصاعدا وهي تنامي قوة المعالجة الحاسوبيةء وكثافة التشبيك الحاسوي» والحوسبة ا منتشرة 
والحوسبة في كل مكان» والتعرّف وتحديد الهوية من خلال زيادة قابلية الفرز والقراءة آلياء 
وأخيرا التخزين امموزّع الواسع النطاق. وقد OS‏ هذه التطورات مجتمعة إلى مجموعة 
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متنوعة من النظم الاجتماعية التقنية التي تنتج البيانات الكبيرة. وقد قدم هذا الفصل 
مسار تتبع أولي لهذه الأنظمة. حيث قسّمها إلى ثلاث فئات واسعة النقاط من أشكال إنتاج 
البيانات: الموججّهة» والآليةء والتطوعية. وينبغي النظر إلى Ji‏ هذا امسار باعتباره خطوة 
أولية في محاولة وضع خريطة لمشهد يتكشف باستمرار. وما هو مطلوب Ut‏ يتمثل في 
مجموعة مفصلة من الدراسات التجريبية التى تدرس JS to‏ أكثر مقا الطرق المختلفة التي 
يتم بها حالياً إنشاء ومعالجة واستخدام البيانات الكبيرة. كما تحتاج مثل هذه الدراسات 
إلى رسم أصول التقاء هذه التقنيات الممكنة وفك مجاميع البيانات التي تم أنشاؤها وكيف 
تطبق عمليا لإنتاج أشكال معينة من البيانات الكبيرة (انظر الفصلين 1 و11). وهذا يشمل 
تفكيك pobe‏ النظام المرتبط بها (انظر الفصل 7). وعند القيام بذلك» هكن الحصول على 
أفكار ورؤى أكثر عمقا لكل نظام اجتماعي تقني ولمختلف العمليات والضوابط والسياسات 
امتصلة به»ء والعمل المتنوع الذي agi‏ به في هذا العام. 

كما ينبغي لمجموعة مصاحبة من الدراسات أن تختبر ما قد يحدث عند ربط 
النظم الاجتماعية التقنية معا لإنشاء أنظمة جديدة أكبر والتي من خلالها تنتج الآثار 
الهامة لتضخم البيانات. كما أن التقنيات التي تقوم عليها البيانات الكبيرة: والبيانات 
نفسها من خلال علائقيتها. هی Lil‏ جاهزة Lh‏ هذه التوسعات. ف الواقع» تكون 
مجاميع اجتماعية تقنية (Socio- E NR.‏ معقدة» مثل سلسلة متاجر التحزثة 
الكبيرة كوومارت j (Walmart)‏ تقوم تقوم وعلى نحو متزايد. بربط العديد من الأنظمة 
مثل إدارة سلسلة التوريد «(Supply Chain Management)‏ تخطبط موارد 
امؤسسات (Enterprise Resource Planning)‏ ادارة علاقات العملاء Customer)‏ 
(Store Management) (55; 4! öylə! «(Relationship Management‏ وأنظمة 
الأمن (Security Systems)‏ والتى تنتج أشكالا من السانات الطموجهة» «AJ Ws‏ والتطوعية 
لإنشاء منظمات معقدة ومتطورة موجهة بالبيانات والتي تترتب عليها آثار متنوعة على 
اموردين واطوظفين والمستهلكين. وباطثلء تحاول مراكز السيطرة والتشغيل للمدن 
الذكية دمج أنواع مختلفة من البيانات التى تم جمعها من مصادر مختلفة في مركز 
واحد حيث يتم الجمع بينها وتحليلها بشكل àl‏ أو لحظی (Real-Time)‏ مما z%‏ 
بشكل جذري الطريقة التي تدار وتحكم بها التجمعات المدنية (انظر الفصل السابع). 


W^"‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 


NZ 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 





ممكنات البيانات الكبيرة ومصادرها 


وقد أثار مثل هذا التوسع وإعادة الضبط العديد من الأسئلة الاجتماعية والسياسية 
والأخلاقية والمعيارية المتعلقة بأنواع الأنظمة والأماكن التى نريد العيش داخلهاء وقد 
bis‏ بالكاد أن JUS‏ ونجس عن هذه الأسئلة (انظر الفصل العاشر). 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة:» والبنى التحتية للبيانات» والنتائج المترتبة عنها WV‏ 
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الفصل السادس 
آليات تحليل السيانات (Data Analytics)‏ 


لسست السانات بحذ ذاتها مفيدة: كما أنها ليست ذات فائدة إلا إذا أمكن استخلاص 
معنى وقيمة منها. وبعبارة أخرىء فإن ما يمكن فعله حيال البيانات هو آمر أهم من مجرد 
عملية إنتاجها؛ إذ ترتكز جميع العلوم على تحقيق معنى وقيمة من البيانات. إن إيجاد 
واستشعار المعنى من البيانات الصغيرة الموسعة والبيانات الكبيرة ينطوي على تحديات 
جديدة. ففي حالة البيانات الصغيرة الموسعة:. يكمن التحدي في ربط قواعد البيانات 
امتنوعة للحصول على رؤى جديدة:. وانفتاح البيانات لتقبل المناهج التحليلية الجديدة 
التي يجري استخدامها مع البيانات الكبيرة. أما بالنسبة للبيانات الكبيرةء فيتمثل التحدي 
في التكيّف مع الوفرة والشمولية (متضمنا ذلك الكميات الكبيرة من البيانات ذات الفائدة 
والقيمة المنخفضة). والمناسبة الزمانية والديناميكية» والفوضى وعدم اليقينء والعلائقية 
«d Lll‏ والطبيعة شبه المنظمة وغير ا منظمة. وحقيقة أن يتم إنتاج الكثير من البيانات 
الكبيرة دون أي سؤال محدد في العقل لتجيب عنه أو أنها في صحبة منتج هو نتيجة ثانوية 
لنشاط آخر. فالواقع» وحتى وقت قريبء تم تصميم تقنيات تحليل البيانات بشكل أساسي 
لاستخلاص رؤى من مجموعات بيانات شحيحة. dolg‏ ونظيفة. وضعيفه العلائقيه» وجرى 
جمعها بطرق علمية وملتزمة بافتراضات صارمة مثل الاستقلاليةء والثبات» والعيارية» كما 
جرى إنتاجها وتحليلها مع وضع سؤال محدد ف الاعتبار )2010 (H.J. Miller‏ 

حتى وقت قريب كان تطوير أدوات للربط بين مجموعات البيانات المختلفة وتحليل 
ib B3 5 CC LR‏ سما Jas Ub aae‏ بطو هذه clas‏ مق الاح 
الحاسوبية. وم يجر تحليل مجموعات البيانات الضخمة بشكل منتظم سوى في السنوات 
الأربعين الماضة أو نحو ذلك. وحتى ذلك الحين كانت هذه التحليلات قائمة غلى مبادرات 
خاصة قادرة على تحمّل الموارد اللازمة. وبدون طاقة حاسوية عالية واسعة الانتشار 
ويمكن النفاذ إليهاء سيكون إيجاد واستشعار المعنى من طوفان البيانات الهائل مكلفا 


YA البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها‎ 85s 
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للغاية أو صعب التطبيق ويستغرق Ég‏ طويلا. وبالطبع» هناك نوع ما من الجدل الدائر 
في الواقع هنا؛ إذ دون الحوسبة الواسعة الانتشار في كل مكان م يكن إنتاج البيانات الكبيرة 
ليكون في المقام الأول. ومع US‏ كما ذكر Hastie et al. (2009: xi)‏ فإنه بالنظر إلى 
«ظهور الحواسيب pasg‏ ال معلوماتء. فقد تفاقمت ال مشاكل الإحصائية من حيث الحجم 
والتعقد». 


وتمثل Jodl‏ لتحديات معالجة وتحليل البيانات الصغيرة الموسّعة والبيانات الكبيرة 
مجموعة جديدة من آليات إدارة المعلومات والتخزين (انظر الفصل الخامس) وتطوير 
أدوات تحليل البيانات الكبيرة. فمنذ بداية الحوسبة استمرت هذه الآليات والأدوات 
التحليلية الجديدة في التطور» وهي تقوم على اختبارات إحصائية: ونماذج: وأساليب تمثيل 
صوري رصينة متبعة» كما أنها تعمل على إنشاء أساليب وطرق جديدة تضرب جذورها 
في البحوث المتعلقة بالذكاء الاصطناعي والأنظمة الخبيرة التي هدفت إلى إنتاج تعليم 
الآلة بحيث مكنها حاسوبيًا وبصورة تلقائية التنقيب» والكشف عن الأنماط. وبناء النماذج 
التنبئية. فمثل هذه الأدوات التحليلية أضحت ملائمة وبشكل مثالي في معالجة واستخلاص 
المعلومات من مجموعات بيانات ضخمة ومتصلة ببعضهاء فقد أصحت تشغل حيزا 
uS‏ من الاستثمار في البحوث من أجل توسيع وإنتاج طرق معالجة جديدة للبيانات 
والخوارزميات الإحصائية والنمذجة وتقنيات التمثيل الصورية (المؤسسة الوطنية للعلوم 
(National Science Foundation 2012‏ وتسعى هذه الآدوات التحليلية: كما هي 
مطبّقة في مجال الأعمال التجارية والعلوم» للإجابة عن أربع مجموعات أساسية من 
الأستلة )2013 :(Minelli et al.‏ 


e‏ الوصف ISh (Description)‏ ومتى حدث ذلك الشيء؟ وكم مرة يحدث؟ 
e‏ التفسير ISU (Explanation)‏ حدث ذلك؟ وما هو تأثره؟ 
e‏ التنبؤ :(Prediction)‏ ماذا مكن أن يحدث بعد ذلك؟ وماذا لو فعلنا هذا أو ذاك؟ 


o‏ العلاج :(Prescription)‏ ما الحل أو النتيجة WA‏ وخشيف مكن تحقيق ذلك؟ 


\As‏ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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وتستمد الإجابة عن هذه الأسثئلة من go jl‏ فئات رئيسة من البات التحليل: التنقيب عن 
البيانات والتعرّف على الأماطء التمثيل الصوري للبيانات وآليات التحليل ås padl‏ التحليل 
«Las VI‏ والتنبؤ وا محاكاة والتحسين. وسيتم مناقشة كل من هذه الفئات باختصارء ولكن 
ينبغي تقديم مرحلة ما قبل التحليل وتعلم الآلة Ysi‏ لأنها مركزية لجميع الفثات الأربعة. 


ما يسبق التحليلات :(Pre-analytics)‏ 
تحتاج كل تحليلات البيانات إلى أن تكون البيانات المطلوب تحليلها معدّة سلفا للتحليل؛ بمعنى 

H.J. Miller (2010) and Han et al. (2011) 3x2 آنه قد جرى تجهيزها والتحقق منهاء وقد‎ 

أربع عمليات فيما يتعلق بالبيانات الموسّعة والكبيرة والتي تطبّق عادة بالتسلسلء على الرغم من 

أنه لا يلزم تنفيذها بأي ترتيب معين» إضافة إلى إمكانية تكرار تنفيذها: 

e‏ اختيار البيانات (Data selection)‏ تحديد مجموعة جزثية من المتغيرات الأكثر قيمة: 
وإطار العينة ال محتمل لهذه المتغترات. حيث لن تكون كل المتتغرات الناتجة ذات 
أهمية. ولا بالضرورة كل نقاط البيانات» فإدراج مثل هذه البيانات غير الضرورية في 
نماذج قد يولد التكرار وعدم الكفاءة. 

o‏ امعالجة المسبقة للسانات :(Data pre-processing)‏ تنظيف السانات ال مختارة لازالة 
الضوضاء أو الأخطاء أو التحىزء أو التعامل مع الحقول المفقودة أو التناقضات وعدم 
السلامة» وهيكلة البيانات لإدخالها في عملية التحليل. 

٠‏ اختزال السانات وإسقاطها :(Data reduction and projection)‏ التقليل من أبعاد 
LUI‏ من خلال التحويلات (على سبل JELI‏ التسوية والصقل (Smoothing)‏ 
وبناء السمات والخصائص» والتجميع» والتطبيع» والتسلسل الهرمي للمفهوم: والأساليب 
الإحصائية مثل تحليل مستوى الانحدار وتحليل المكونات الرئيسية) لمكافأة تمثيل 
البيانات ولكن بصورة أكثر كفاءة. 

o‏ إثراء البيانات :(Data enrichment)‏ دمج البيانات المختارة مع سانات أخرى (مثل 
بيانات التعداد السكانى وبيانات السوق) من أجل الوصول إلى رؤى يمكن الاستفادة منها 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة:» والبنى التحتية للبيانات» والنتائج المترتبة عنها ۸۱ 
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فمن جهة» صمّمت كل خطوة من هذه الخطوات من أجل زيادة نوعية السانات 
المستخدمة ف التحليل» ومن جهة أخرىء باستثناء إثراء البيانات. من أجل تقليل حجم 
البيانات التي على التحليل التعامل معها. فالأول تم تصميمه لتعزيز صحة وصلاحية 
الاستنتاجات المستخلصة بالنظر إلى الفوضى الكامنة وعدم اليقين في البيانات الكبيرة (انظر 
الفصل التاسع)ء في حين يهدف الثاني إلى زيادة الكفاءة التشغيلية مع الأخذ بعين الاعتبار 
أحجام البيانات وسرعاتها والأحمال الحاسوبية. ومن ال ممكن أن يكون من الصعب القيام 
بهذه elall‏ عند إجراء التحليلات بشكل آني أو لحظيء وخاصة فيما يتعلق بتنظيف البيانات. 
ونتيجة لذلكء وفيما عدا التمثيل الصوري للمؤشرات» لا يجري تحليل البيانات الكبيرة آنيا 
أو بشكل لحظي» ولكن يجري التحليل على سلاسل تمثل عينات كبيرة جذا لبيانات Ai s‏ 
ومختزلة» ومخصّبة (ثرية) وخلال أزمان مختلفة. أما إذا كان المطلوب تحليلات بشكل I‏ 
أو لحظى» فتطبّق في العادة التحليلات المسبقة OLLU‏ مقدمًا على عينة من أجل تحديد 
طبيعة السانات وكيفية التعامل معها للانتقاءء والاختزال: والتنظضف على عجل. 

ويعد إثراء البيانات مهمة col‏ قيمة عالية لأنها تنتج أثرًا مَضحما Crampton et al.)‏ 
2012( تمكن من اكتساب رؤى لا مكن الكضول lale‏ من خلال قاعدة bL‏ واحدة. 
وبحسب من تمت مناقشته في الفصل الثاني» فإن المبرر الرئيسي لإنشاء البنى التحتية 
للبيانات تمثل في إعادة استخدام البيانات. وإن التحدي يتمثل في إنشاء طرق لربط البيانات 
التي أنتجت لأغراض مختلفة بعضها «aso‏ والتى قد تختلف أيضا في البيانات الوصفية 
امصاحبة لهاء ومعايير اليانات؛ ووحدات القياسء والإجراءات» والفئات» والنطاق» والتزامن؛ 
وتنسسيقات الملفات» أو إنشاء طرق للربط لتقليل حدوث ال مغالطات ال محتملة الناتجة عن 
الاستدلال .(Creation of Potential Ecological Fallacies)‏ وهذه لست D yu dago‏ 
ولكن تعمل الأساليب الحاسوبية على جعلها أسهل من خلال استخدام الخوارزميات التى 
يمكنها البحثء المطابقة, egol‏ إعادة الجمع من خلال أنواع مختلفة من التحولات» وإعادة 
تهيئه البيانات. وبالنتيجة. يمكن التنقيب والتحليل في مجموعة بيانات جديدة باستخدام 
الفتات الأربع الرئيسية للتحليلات التى سيجري نقاشها آدناه. 


A۲‏ ثورة السانات السانات !6545( والسانات المفتوحة» والىنى التحشة للسانات» والنتائج dahl‏ عنها 
M s 2‏ 5 . 4 يديو ج 
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ويمكن أن تكون أعمال التحليلات المسبقة مملة باستغراقها وقنّا طويلا للغايةء ولكنها 
مع ذلك مهمة جدًا ولا يمكن تجاهلها. وبالنظر إلى الزيادة المنقطعة النظير في مختلف 
أنواع البنى التحتية الجديدة للبيانات والبيانات الكبيرة» فقد أصبحت منطقة ثرية للبحث 
حيث يسعى علماء البيانات إلى إيجاد طرق أكثر إنتاجية وكفاءة وفعالية لإتمام. وخصوصا 
az‏ هذا العمل. 


تعليم à NI‏ أو :(Machine learning) ANI NEST‏ 
يمكن إجراء تحليل الأعداد الكبيرة جذا من سجلات البيانات في إطار زمنى مناسب عن 
طريق الخوارزميات الحاسوبية. وفي حين أن الكثير من عمليات تحليل البيانات الكبيرة 
مكن إجراؤها بالطرق نفسه المتبعة قي تحليل البيانات الصغيرة. حيث يتخذ ال محللون 
القرارات المتعلقة بالكيفية التي يتم فيها الاستكشاف من خلال هذه الخوارزميات» فإن 
الهدف من أغلب البحوث هو تطوير عمليات مؤتمتة مكنها e‏ السيانات والتعلم منها 
ومن تحليلها. ويطلق على هذه العمليات المؤتمتة مصطلح تعلم الآلة أو التعلم JS!‏ 
وتشكل أحد فروع الذكاء الاصطناعي. ويهدف تعلم الآلة إلى التطوير المتكرر لفهم 
e gams‏ البيانات؛ والتعلم التلقان لإدراك أنماط معقدة 6 slug‏ نماذج توضح وتتوقع مثل 

هذه الأأماط؛ وتحسين النتائج )2011 (Han et al.‏ 


ويتكون تعلم الآلة بشكل عام من نوعين رئيسيين: مُراقب (باستخدام بيانات التدريب) 
وغير مراقب (باستخدام التنظيم الذاق): فى التعلم Shh‏ يقم تدريب نموذج لمطايقة 
المدخلات مع مخرجات معلومة. على سبيل oS JELI‏ تدريب النموذج لمطابقة الرموز 
البريدية المكتوبة بخط اليد مع مثيلاتها المطبوعة (I‏ أو التنبؤ بنتائج معينة, فهي «مراقبة» 
بمعنى أن بيانات التدريب موجودة لتوجيه عملية التعلم )2009 (Hastie et al.‏ فى ا مقابلء 
تسعى نماذج التعلم غير الخاضعة للرقابة إلى تعليم نفسها على اكتشاف الأنماط وإيجاد هياكل 
البيانات دون استخدام بيانات التدريب. وبشكل «ele‏ يمكن تحقيق ذلك من خلال تحديد 
مجاميع وعلاقات بين البيانات التي لم يكن معروفا بينها مسبقا خصائص للتشابه أو الارتباط. 
فعلى سبيل «JUI‏ يمكن أن يتعلم النموذج على كيفية تقسيم العملاء إلى مجموعات ذاتية 
d Blaze‏ والتنبؤ بالمشتريات لتلك المجموعات )2011 (Han etal.‏ فى كلتا الحالتين» يتم 
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إنشاء نموذج من خلال عملية التعلم التي شكلتها القواعد والأوزان التي توجه كيفية بناء 
موذج فيما slu dlas l..39 .(Hastie et al. 2009) SLLJL (also‏ نموذج من slo‏ بسيط 
ذم يتم التعديل مرارا وتكرارا على ذلك البناء باستخدام قواعد التعلم بالمثل كما يطبق مع 
الطفرات «A aJ‏ إلى أن يتطور البناء إلى نموذج قوي )122 :2013 .(Siegel‏ وهناك شكلان 
للتعلم امراف وغير SERI‏ وهما التعلم شبه امراق الذي يشتمل على استخدام Js‏ من 
التدريب والبيانات التي لا تحمل عناوين (وهي البيانات التي يمكن الحصول عليها بسهولة 
ولكنها غير مسماة كالصور والتسجيلات الصوتية. والفيديوء المقالات «do JL VI‏ وغيرها من 
البيانات الخالية من أي ملصقات تتيح التعرف عليها بشكل (SÍ‏ والتعلم النشط الذي يتيح 
للمستخدمين القيام بدور نشط في توجيه نموذج التعلم )2011 (Han et al.‏ 

وقد جرى استخدام التعلم الآلي في جميع عمليات تحليلات البيانات الكبيرة الأربع: 
على الرغم من أن هذه التحليلات ليست مقتصرة في عملها على هذه الطريقة. je‏ 
إجراؤهاء في كثير من الحالات» من قبل الباحث بشكل مباشرء وحتى ضمن التعلم الاي 
يبقى'اللحلل ودوره مهما في الحكم على العملية وتوجيهها وتقييم النتائج الوسيطة. كما 
لاحظ )2010( os H.J. Miller‏ التعلم JYI‏ ليس مجرد Ub ele‏ وسهل JULI‏ بل 
شات 555 dà as $39 Jio b‏ وهي المهارات التي لا يزال العقل البشري أفضل بها من 
أجهزة الحاسب JYI‏ وبينما تم إحراز تقدم كبير في تطوير تقنيات التعلم «JV‏ فإنه y‏ 
يزال من العلوم الناشئة التي مازالت بحاجة إلى الكثير من البحث لتحسين فعالية ومتانة 
النماذج المنتجة. 

وفيما «Jo‏ سيتم مناقشة كل did‏ من فئات التحليلات الرئيسية على حدة. على الرغم 
من أنه تجدر الإشارة إلى ul‏ غالبا ما تستخدم e‏ إلى جنب. على سبيل «JUL‏ ينبغي أن 
يوفر التنقيب عن البيانات والتعرف على الأنماط أسس التنبؤ/التوقع أو التحسينء ويمكن 
استخدام الإحصاءات في التنقيب عن البيانات للكشف عن الأنماط أو في حساب التوقع/ 
التنبقؤ وقد يستخدم التمثيل الصوري في التنقيب عن البيانات» أو لتحصيل ا مخرجات من 
أنظمة المحاكاة... إلخ. 
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التنقيب عن البيانات والتعرّف على الأنماط (Data Mining and Pattern Recognition)‏ 

التنقيب عن البيانات هي عملية استخلاص البيانات وأنماط من مجموعات البيانات 
الكبيرة )2011 .(Manyika et al.‏ ويقوم التنقيب عن البيانات على مفهوم امتلاك كل 
مجموعات البيانات الضخمه معلومات مفيدة ذات معنى على صورة غير ilg Le‏ وذات 
صلاحية سارية ال مفعولء وقابلة Alg U‏ 624225( ومفهومة في نهاية Han et) SLI‏ 
(al. 1‏ وبا لمثلء يستخده التعلم JYI‏ المراقب وغير المراقب للكشف والتصنيف 
والتقسيم عن العلاقات والارتباطات والاتجاهات ذات ال مغزى بين المتغيرات. وهي تقوم 
بذلك باستخدام سلسلة من التقنيات Le‏ في ذلك معالجة اللغات الطبيعيةء والشبكات 
العصبية. وأشجار اتخاذ القرارء والأسالس الإحصائية (دون معاملات وذات المعاملات). 
وتختلف طريقة الاختيار بين نوع البيانات (المنظمة: pég‏ المنظمة» وشبه المنظمة) والهدف 
من هذا التحليل(انظر الجدول١‏ - (( 


الحدول رقم Y)‏ - 1( 
مهام وأساليب التنقيب عن البيانات 


مهمة التنقيب عن البيانات الوضف 


التجزئة أو التجميع تحديد قانئمة من ال مجموعات 
Segmentation or)‏ الضمنىة التي تصف السانات 
(Clustring‏ 


(Cluster Analysis) aدوقنعلا التحليل‎ 


التصنيف (Classification)‏ التنبؤ باسم الفئه التى تنتمى 
إليها مجموعة من البيانات 


legame uas ونام إل‎ 


تصنيف النظرية الافتراضة 
(Bayesian Classification)‏ 


استقراء شجرة القرارات 


(Decision Tree Induction) 
aS JJI duas) الشسكات‎ 
(Artificial Neural Networks) 


äi‏ دعم التمييز 





(Support Vector Machine) 
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(Association) Ja Jl‏ إيجاد روابط بين OUS‏ قوانين الارتباط 
البيانات؛ S JI‏ بقيمة بعض 
الحقول بالاعتماد على قيمه 

حقول أخرى 


(Association Rules) 


تصنيف النظرية الافتراضية 
(Bavesian Classification)‏ 
الانحراف (Deviation)‏ إيجاد pole‏ السانات التحليل العنقودي 
امعرضهة للانحراف عن 
المتوقع 


(Cluster Analysis) 
كشف الانحراف‎ 
(Outlier Detection) 
تحليل التطور‎ 
(Evolution Analvsis) 
(Regression) الاتجاهات وامنحنيات التى الانحدار‎ (Irends) الاتحاهات‎ 

تلخص قواعد السانات» عادة 


عبر الزمن 


استخلاص تسلسل النمط 
(Sequence Pattern Extraction)‏ 
التعميم (Generalization)‏ | دمج مواصفات البيانات القواعد والقوانين 9l!‏ 652 
(Summary Rules)‏ 
Attribute-Oriented Induction)‏ ( 





المصدر: 7 :2009( (Miller and Han‏ 
إن معظم الآليات المدرجة في الجدول )6-1( تتصل بالبيانات المنظمة كتلك الموجودة في 
قواعد البيانات العلائقية. على سبيل مثال» من الممكن تطبيق نماذج التجزئة على قواعد بيانات 
عملاء التجزئة ومشترياتهم لتقسيمهم بحسب معرّفات مختلفة بالاعتماد على خصائصهم 
وأنماط سلوكهم من أجل تقديم عروض/ خدمات مختلفة لكل مجموعة مختلفة. وف تحليل 
الشبكات الاجتماعية. oce‏ تحليل الروابط بين الأفراد لفهم ا متغيرات الاجتماعية وكيفية تدفق 
المعلومات فيما بينهم. وفي كشف الارتباطات» هكن استخدام مجموعة متنوعة من نماذج 
الانحدار في الكشف عن الروابط لحساب الاقترانات بين المتغيرات: ومن ثم الكشف عن الأنماط 
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الخفية التي يمكن الاستفادة منها لتحقيق مكاسب تجارية (على سبيل ا مثال» تحديد ما يتم 
شراؤه كوحدة من البضائع وإعادة تنظيم ال مخزون لتعزيز الشرائية) (انظر الفصل السابع). 

وتثير البيانات غير ال منظمة» والتي تكون على شكل نصوص أو صور أو أصوات» تحديات 
خاصة فيما يتعلق بالتنقيب عن البيانات. فاليات معالجة اللغات الطبيعية تهدف إلى 
تحليل اللغة الإنسانية التي يجرى التعبير عنها من خلال الكلمة المكتوبة والمنطوقة. وهي 
تستخدم دلالات وتصنيفات من أجل التعرّف على الأنماط واستخراج ال معلومات من الوثائق. 
وتشتمل الأمثلة على استخراج العنصر الذي يستخرج البيانات الوصفية من النص بصورة 
تلقائية من خلال البحث عن أنواع معينة من النصوص والتعابير. مثل أسماء الأشخاص 
وا مواقع والتواريخ وا مصطلحات التخصصية والتراكيب المنطقية؛ واستخراج العلاقات التي 
تحدد تلقائيًا العلاقات بين العناصر الدلاليةء وربطها معا (على سبيل JELI‏ اسم الشخص 
وتاريخ ميلاده أو مكانه» أو رأيه ببند (McCreary 2009) (L‏ ومن التطبيقات النموذجية 
مثل هذه الاليات التحليل الوجداني الذي يسعى إلى تحديد الطبيعة العامة للاراء وقوتها 
حول قضية ماء على سبيل JELI‏ ما يقوله الناس عن ال منتج على وسائل التواصل الاجتماعي. 
كما مكن تعقب أماكن نشوء هذه الاراء باستخدام البيانات الوصفية الموضعية Graham)‏ 
al. 2013‏ ) والتنقيب عن نشر المعلومات داخل وسائل التواصل الاجتماعي: على سبيل 
Jols JELI‏ عناوين ال مواقع الإلكتزونية الأكثر تفضيلا lai Liao‏ بين Calio‏ المستخدمين 
.(Ohlhorst 2013)‏ فهذه المعلومات مفيدة للشركات» مثل الوكالات الإعلانيةء Sas ls‏ 3« 
والخدمات الماليةء والتي تسعى إلى الاستفادة من الاتجاهات الناشئة والوصول المنظم في 
الوقت المناسب (على سبيل «JULI‏ لوضع إعلانات تتناسب مع الأحداث الجارية؛ لبيع وشراء 
الأسهم قبل ردة الفعل العنيفة للسوق). 

أما الصور فيتم إنشاؤها للتخزين والعرضء وليس للمحتوى والبحث )2013 (Ohlhorst‏ 
فكشف وتصنيف واستخراج أنماط داخلهاء مثل التعرف على الوجه أو مكانء ليس بالأمر 
السهلء ولكن يتم التعامل مع ذلك من خلال تقنيات ال مسح التصويريء والاستشعار عن 
تعد dadlsag‏ الضور وتقنيات الاسعصار الآلة.:متضمنا ذلك التغرق على «LI‏ ومطائقة 
القالب باستخدام مجموعات التدريبء وطرق التجميع» والشبكات العصبية. وتتفاقم 
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مشكلة التنقيب في الصور عند محاولة استخراج» ومقارنةء وفهرسة الأماط لعدد هائل من 
الصور )2001 et al.‏ 71328). وبرغم أن التنقيب ف الصور لا يزال من المواضيع الناشئة 
إلا أنه أصبح أكثر تقدمًا في السنوات الأخيرة. فعلى سبيل «JULI‏ فإن الموقع الإلكتروني 
على شبكة الإنترنت: (http://imagevision.com)‏ يدعي al‏ سيكون قادرا على تصنيف 
0 دقيقة من الفيديو في الساعة الواحدة: لكل خادم» وذلك باستخدام خوارزميات 
التعلم الآلى للكشف عن بعض الخصائص Jis‏ العري وشعارات الشركات. 

التمثيل الصوري للبيانات وآليات التحليل الصورية Data Visualisation and)‏ 
:(Visual Analytics‏ 


شاعت مقولة تنص على أن صورة واحدة تغني عن ألف كلمة. وبامثلء جرى استخدام 
ال ru IL cio‏ #الفرووضف مجموغات السانات من ia EM‏ والرسومفات 
الإحصائية» والرسوم البيانيةء والخرائط. والرسوم المتحركة. وتكشف هذه الأساليب البصرية 
وتوصل على نحو فعال هيكل المتغيرات» وأنماطهاء واتجاهاتهاء والروابط بينها. وبالنظر إلى 
الحجم الهائل للبيانات الكبيرة وسرعتهاء فليس من المستغرب إذا أن التمثيل الصوري قد 
صار وسيلة شعبية لاستشعار البيانات وإيصال هذا الشعور. 


ويمكن استخدام التماثيل الصورية الناشئة ضمن عام التقنية الرقمية للتنقل والاستعلام 
عن البيانات» مما يتيح للمستخدمين الحصول على dole dab‏ عن كامل مجموعة البيانات. 
بالتركيز على البنود المهمةء واستبعاد البيانات غير المهمة: واختيار عنصر بياني أو مجموعة 
من البيانات والحصول على مزيد من التفاصيل» وعرض العلاقات بين العناصرء واستخراج 
مجموعات فرعبية من التفاصيل عند الحاجة )1996 .(Shneiderman‏ وعند عمل ذلك. مكن 
الكشف عن خصائص وبنية مجموعات البيانات» وأكثر من ذلك مكن استخدامها لتوضيح 
وفهم النماذج ومجموعات البيانات المعقدة التي يتعذر تمثيلها بطريقة مجردة وواضحة 
ومفهومة (مثل الظواهر الذرية» والظواهر الفلكية الثلاثية الأبعاد)» ورسم عشرات الآلاف 
من نقاط البيانات للكشف عن البنية» والتجميعات» والثغرات» والقيم الشاذة التي قد تظل 
بدلا من ذلك مجهوله فى الخفاء )1996 (Shneiderman‏ على سبيل JELI‏ استيعاب وفهم 
ملايين التغريدات على شبكة التواصل الاجتماعي تويتر ليست مهمة سهلة. فيمكن للمرء 
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الحصول على فكرة تقريبية عن القصص أو المواضيع التي تبدو els‏ ولكن الحصول على 
نظرة dole‏ وشامله هي dago‏ غاية في الصعوبة؛ 44259 تغير التوجه على مستوى الجماهير 
والأماكن. فأحد الحلول يتمثل في رسم خريطة تغريدات موزعة جغرافيًا ومصنفة بحسب 
ا ميول والأهواء. وهو نهج جرى الأخذ به من خلال فريق عمل الموقع الإلكتروني http://)‏ 
75 لقند أنشؤوا عشرات الخرائط حول توجهات المواضيع والتغريدات» 
واشتمل ذلك على الشكل (X - Y)‏ والذي يعرض التوزيع الجغرافي لتغريدات التخوف من 
ا مثليين في الولايات المتحدة من يونيو ۲۰۱۲ م وحتى إبريل 7٠١١١‏ م. كما أنهم عرضوا 
محتوى موسوعه الويكيبيديا وجوجل بالنسبة مواضع التوزيع الجغراق حول العام. 

ويشيع استخدام التمثيل الصوري أيضا ليكون وسيلة للمراقبة الآنية ا مستمرة لظاهرة 
ما بشكل آني أو لحظى» مما يتيح تعقب ورصد العديد من المتغيرات عبر الزمان واممكانء 
واطقارنة بينهاء وتحديد التغيير الحاصل. فلوحات التحكم والعرض (Dashboards)‏ 
للبيانات المتغيرة تكون غالبا معروضة على شاشات الحاسب الآلى في غرف التحكم الحديثة 
وهي تلخص على نحو صوري الأنظمة المتغيرة باستمرار للمشغلين الآدميينء مع سلاسل 
زمنية ورسوم بيانية وخرائط للكشف عن الأحداث (انظر ليك 2013 Lake‏ للمقارنة بين 
dog! ٤‏ عرض). وعلى سبيل JELI‏ يمكن أن توفر البيانات من مختلف أنحاء نظام النقل 
خريطة لتدفق حركة ال مرور وتقارير الحوادث بشكل آني أو لحظي؛ أو مواقع الطائرات 
خلال مروزها غير منطقة ما lol)‏ الشكل Y‏ - 1): كما قد توفر يانات رادار الظكّس خريطة 
لهطول الأمطار بشكل آني أو لحظي ومحاكاة للساعات القليلة ا ماضية. فمثل هذه البيانات 
الصورية لا تساعد ضباط إدارة حركة المرور والراصدين الجويين فقطء ولكن أيضا المواطنين 
الذين يمكنهم الوصول إليها ومتابعة الأوضاع الجارية باستخدام الحاسب الآلى أو الهواتف 
الذكية basg‏ سلوكهم لتجنب طرق معينة أو التعامل بشكل مناسب مع المستجدات. 
ومثال على نموذج Joi‏ للوحة تحكم خاصة بمدينة dole‏ تضم مجموعة من البيانات 3Nl‏ 4 
أو اللحظية عن الطقس» وتلوّث الهواء» ومعوّقات حركة مرور النقل العام وتوافر الدراجات 
العامة» ومستوى ارتفاع ا منسوب GUI‏ النهريء وارتفاع الطلب على الطاقة الكهربائية 
وسوق الأوراق اطالية» واتجاهات التغريدات على شبكة التواصل الاجتماعي تويترء وتغذية 
كاميرات مراقبة حركة المرور تلك ال معروضة à‏ الشكل Y)‏ 
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ومن الممكن أيضا استخدام التمثيل الصوري كشكل من أشكال الاستنتاج التحلياى. 
وهناء لا يصف أو يعرض التمثيل الصوري مجرد البيانات فقطء ولكن يجري استخدامها 
lol‏ تحليلية. ويتم توجيه هذه الطريقةء والتي يطلق عليها مصطلح التحليلات الصورية. 
في الغالب بواسطة مجموعة من الأشخاص والخوارزميات التي تعمل باتساق لاستخراج 
البيانات» وبناء النماذج البصرية وتفسيرهاء والمضي LÉS‏ في ا مزيد من التحليل الإحصائي 
(Keim et al. 2010)‏ لقد أصربحت آليات التحليل البصرية مجالا هذا وجديدا من 
مجالات البحثء وهو الأمر الذي أسهم في تطوير حقل التمثيل الصوري للمعلومات من 
خلال دمج عناصر التنقيب عن البيانات» وعلوم الإحصاء والإدراك Thomas and Cook)‏ 
6. فالعديد من أنواع الرسومات البصرية المختلفة شائع الاستخدام» وهى في العموم 
تفاعلية وتتيح للمستخدم التعامل معها والتلاعب في الصور من أجل البحث والكشف 
عن الأنتماط والروابط. وبالإضافة إلى ذلك. فإن الشاشات ال معروضة للمستخدم متصلة 
ببعضها في الغالب بحيث إن التفاعل مع إحداها ينعكس على الأخريات» مما يمكن من 
تفخص جوانب من البيانات من أكثر من منظور واحد ق ذات الوقت. فعلى سبيل «JU‏ 
يعرض الشكل (1-6) أنواع آليات التحليل الصورية المتاحة ضمن أدوات آليات التحليل 
الصورية (GAV)‏ الموضوعة من قبل المركز الوطني للتحليلات الجغرافية الصورية في 
جامعة ينكوبينج (Linkóping University)‏ في السويد. بالإضافة إلى توفيرها مجموعة 
مق الأذوات التكللة: ميان أذوات المجفوقة من Coles‏ الانات JS lads zug‏ 
تعاونيء وبناء التطبيقات» والتداخل مع تطبيقات الخرائط كخرائط جوجلء وبناء وتبادل 
القصص السردية. وينشئ الأخير يعدا اجتماعيا للآأدوات» مما mo‏ الزملاء وغيرهم من 
Jal‏ تفسيرات حسية متعلقة بالتمثيل الصوري (انظر الشكل ه - (V‏ 


التحليل الإحصاني (Statistical analysis)‏ : 
هناك تاريخ طويل من الأساليب الإحصائية التي يجري تطبيقها على البيانات الكمية في 
محاولة لفهمها. فالإحصاء الوصفي يفصل خصائص وتوزيع نقاط البيانات ومستوياتها من 
الخطأ وعدم اليقين. ويشتمل الإحصاء الوصفي على تحليل السلاسل الزمنية التي تنص على 
كيفية تغيّر البيانات بمرور الزمن» ونظرية الرسم البياني التي تدرس بشكل رياضي تنظيم 
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هياكل الشبكة: والإحصاء ال مكاني الذي يصف هندسة وأنماط التجميع» والتشتتء والانتشار 
في حين يسعى الإحصاء الاستدلالي إلى شرح وليس مجرد وصفء الأنماط والعلاقات التي 
قد توجد داخل مجموعة البيانات» واختبار قوة وأهمية الارتباطات بين المتغيرات. كما 
يشمل الإحصاء البارامتري (المعلمي) الذي يجري استخدامه لتقييم الفرضيات باستخدام 
بيانات الفاصل الزمني وبيانات مستوى النسبةء مثل الارتباط والانحدار؛ والإحصاءات غير 
المعلمية المستخدمة لاختبار الفرضيات باستخدام بيانات ا لمستوى الاسمية أو الترتيبية؛ 
والإحصاءات الاحتمالية التي تحدّد احتمال حدوث حالة ماء مثل تحليل النظرية الافتراضية 
(Bayesian)‏ ويجري تطبيق تقنيات الإحصاء الوصفىي والاستدلالي التي تستخدم تقليددا 
في تحليل البيانات الصغيرة في البيانات الكبيرة أيضاء وكما جرى نقاشها في الفصل التاسع 
فإن هذا ليس سهلا على الدوام ON‏ الكثير من هذه التقنيات جرى وضعها لرسم رؤى من 
البيانات الشحيحة وليست المتوافرة بشكل فائض. ومع ذلك» توفر هذه التقنيات وسائل 
للاستفادة من كميات البيانات الهائلةء كما يضمن حجم البيانات الهائل إمكانية تجزئتها إلى 
مجموعات بطرق عديدة دون أن تصبح صغيرة lao‏ مما لا مكن معه حساب الاختلافات 
بين مجموعتي الضبط وامعالجة بصورة ذات معنى. وتستخدم الإحصاءات بشكل روتيني 
في المساعدة على التنقيب عن البيانات والتنبؤ بها وتحسينها (انظر الجدول ١‏ - 1). 


التوقع والمحاكاة والتحسين :(Prediction, SimulationandOptimisation)‏ 

هناك طريقة أساسية في الحصول على القيمة من البيانات وهي استخدامها لمحاولة 
معرفة أو توقع ما سيحدث في ظل ظروف مختلفة. على سبيل JL‏ قد ترغب شركة ما في 
توقع ردود أفعال العملاء تجاه منتج معين أو حملة ماء أو قد تحتاج الحكومة اممحلية إلى 
محاولة التنبؤ بكيفية عمل البنى التحتية للنقل إذا جرى إغلاق عنصر مهم ذو حساسية. أو 
قد يسعى العلماء إلى التنبؤ موعد احتمال حدوث انهيار أرضي وتحت أية ظروف. إن مثل 
هذه ال معلومات مفيدة جدا للمنظمات من حيث تمكينها من التخطيط لحالات الطوارئ 
ا لمختلفة»ء وللشركات من حيث إنتاج Sl‏ لزيادة نمو الأرباح (انظر الفصل السابع). وف 
جميع الحالات» ثُبنى النماذج باستخدام المعرفة القائمة سلفا عن كيفية عمل النظام: والتي 
تعالج البيانات لتقدير النتائج المحتملة في ظل سيناريوهات مختلفة. وكما ف التنقيب عن 
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البيانات. هناك العديد من الطرق المختلفة التي مكن استخدامها لإنتاج النماذج التنبئية. 
JS Js‏ منها نقاط قوتها وضعفهاء وهي تنتج تنبؤات أقل خطأ أو أكثر دقه بالاعتماد على 
نوع المشكلة والبيانات )2010 (Seni and Elder‏ ومع ذلك» من الصعب الحكم مسبقا 
على أن أي نوع من النماذج» وإصداراته ا مختلفة. سيعمل بشكل أفضل على أي مجموعة 
بيانات ممُعطاة. وقد تمثل الحل لهذه المسألة في استخدام نهج مركب يستفيد من الكمية 
الهائلة من الطاقة الحاسوية ال متاحة للمحللين الان )2013 Loss (Siegel‏ عن اختبار 
نهج واحد وبناء عدد قليل من النماذج» فالنهج المركب يبني نماذج متعددة باستخدام 
مجموعة متنوعة من التقنيات للتنبؤ بالظاهرة نفسها. وبعد ذلك» بدلا من تحديد النتائج 
(التقديرات) من النموذج الأفضل أداء» يجري العمل على الجمع بين التقديرات من جميع 
النماذج لإنتاج إجابة واحدة شاملة. ويؤدي تجميع النتائج إلى نتائج aS]‏ قوة € كما تعوض 
العملية bli‏ الضعف في كل نموذج. على سبيل «JUL‏ قد يبني نهجا مركا لتؤقع سلوك 
العملاء سلسلة من نماذج الانحدار» والشبكات العصبيةء والجار الأقرب» وشجرة القرارات. 
فكل نموذج قد يكون أفضل من غيره في التنبؤ بأنواع معينة من المستهلكين» ولكن يمكن 
تقليل الفروقات من خلال الجمع بين مخرجات النموذج» مما يزيد التنبؤ قوة Franks)‏ 
Siegel 2013‏ ;2012(. فباستخدام طريقة تضم العديد من النماذج ال منسجمة مكن تطبيق 
coL st‏ من الخوارزميات المختلفة على مجموعة بيانات» ومن ثم ضمان إنتاج أفضل نموذج 
تنبؤي ممكن. 

فالمحاكاة هي عبارة عن نماذج تسعى إلى نمذجة العمليات والأنظمة في العام الحقيقي. 
والهدف من ذلك هو تحديد كيفية عمل نظام ما وكيفية سلوكه وفقا لسيناريوهات مختلفة. 
وتقييم آداتها Las‏ بهدف تحسنن كفاءتها وفعاليتها )2003 .(Robinson‏ ومن الأمثلة 
الشعبية لعبة الحاسب الآلي سيم سيتي (SimCity)‏ التي تحاي كيف يكن ممدينة أن تنمو 
وتتطور في ظل ظروف يختارها اللاعبونء قاثمة على أساس النموذج الكامن وراء العمليات 
المدنية المعروفة. وبا مثلء تستند توقعات الطقس على محاكاة لكيفية تطور الطقس بالنظر 
إلى الظروف السائدة والمعرفة العلمية. وهناك العديد من الأنواع المختلفة لنماذج المحاكاق 
والتى استفاد كثير منها من التعلم SI‏ من أجل تحسين عمل النموذج بشكل تلقاني 
والتعامل مع الخصائص الناشئة مثل الأحداث غير المتوقعة. إن نموذج سيم سيتي هو 
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نموذج قائم على التوكيل )2007 (Agent-based) (Batty‏ ويتكون هذا النموذج من dis‏ 
تمكن من تعيين خصائص معينة للميزات الفردية فيها مثل المباني والطرق. ويتم تعيين 
خصائص هذه البيئة بواسطة Wg‏ وعند تشغيل النموذج» يسعى الوكلاء إلى حل مهمة ما 
والتفاعل مع البيئة وغيرهم من الوكلاء الاخرين بالاعتماد على خصائصهم ال مسندة إليهم. 
وبالمحصّلة. عند قيام الوكلاء pel‏ يقومون بتغيير البيئة» وهي (à‏ هذه الحالة المدينة 
التي يسكنونهاء وإنتاج نظام معقد ومتغير. ومن ثم فإن النظام يعمل من أسفل إلى «Ael‏ 
مع أنماط مكانية وزمانية تتغيّر من تفاعلات الوكلاء الفردية مع البيئة. وتستخدم Jia‏ هذه 
النماذج محاكاة القضايا المدنية خارج الألعاب لنمذجة استخدام الأراضي وتخطيط النقل 
ووضع خطط الطوارئ للكوارث )2007 (Batty‏ 


ويهتم التحسين بتحديد الإجراء الأمثل لتحسين الأداء (عادة من خلال خفض التكلفة 
أو زيادة العائد أو المخرجات). ويمكن حساب التحسين باستخدام وتقييم نماذج التنبؤ 
وا محاكاة, أو تطويرها من خلال أنواع أخرى من الخوارزميات أو الاختبار الإحصاني. فعلى 
سبيل JEL‏ تستخدم الخوارزميات الجينية. وهو نوع معين من التعلم الآلي: الأفكار 
امنتقاة من الطبيعة. مثل الوراثةء والطفرات. والاختيار والتهجين. لوضع وتطوير حلول 
ممكنة لمشكلة ما )1996 (Mitchell‏ كما يسعى ele‏ الشبكات العصبية» وهو نهج ]9 
مستوحى بيولوجياء لمحاكاة LAS‏ عمل الدماغ البشري» باستخدام عناصر ال معالجة العالية 
الترابط لحساب وتقييم وحل مشكلة ما )2000 .(Picton‏ كما يمكن استخدام اختبار cll‏ 
(A/B Testing)‏ بشكل دوري لتقييم وتطويع نظام ماء من خلال dijlis‏ مجموعة ضوابط 
مع مجموعات اختبار مختلفة من أجل تحديد العلاجات (على سبيل JELI‏ النصوص. 
والتصاميم» والصورء والألوان اللمستخدمة على موقع إلكتروني على الإنترنت) لتحسين هدف 
معين (على سبيل اطثال. معدلات التبرع). 


الخلاصة: 
كان الهدق هن هذا الفضل:تقديم حة dele‏ عن de same‏ من الآليات الناشثة وتخليلات 


البيانات التي يتم استخدامها لمعالجة وتحليل وتطبيق البيانات الصغيرة الموسعة والبيانات 
الكيرة. لقد تم Jo‏ مثل هذه الأساليت لعدد من «Sla ul‏ ولكنها أصبحت أكثر انتشارا 
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ويمكن الوصول إليها مع تطورها ونضجهاء وتوفر المعالجة الحاسوبية المطلوبة لتصبح متاحة 
على نطاق أوسع. ومع «US‏ يطرح حجم وسرعة البيانات الكبيرة تحديات جدية OUS‏ 
التحليل وما قبلها بسبب عدم تصميم العديد من هذه الاليات التقليدية والخوارزميات 
لتتناسب مع المليارات من ال ملاحظات. أو لتتعامل مع مجموعات بيانات سريعة التغير 
.(Batty et al. 2012)‏ ومن ثم فمن الواضح أن هناك حاجة إلى مزيد من البحوث 
لتكييف. وصقل وتوسيع الآليات الحالية وابتكار أساليب جديدة يمكن لها إضفاء معنى من 
البيانات الكبيرة والبنى التحتية للبيانات واستخلاص القيمة منها. وعلاوة على ذلك» أضحت 
الأجيال الجديدة والقديمة من العلماء ومحللى الأعمال. على حد سواء» بحاجة إلى التعرف 
على مصادر البيانات الجديدة وخصائصهاء وأن تتعلم مجموعة جديدة من المهارات إذا 
كانت تريد أن تكون قادرة على الدراسة والاستفادة من رؤى وأفكار طوفان البيانات «e3UJI‏ 
متضمنا ذلك معالجة البيانات المنظمة والبينات غير المنظمة» والترميز الأساسي» والتنقيب في 
البيانات» والتمثيل الصوريء والنمذجة: والمحاكاة (انظر الفصل التاسع). 

إن هذه التحديات لا تقوم على مجرد أسس تقنية أو موارد بشرية. فإن آليات التحليل 
تعد انعكاسًا لطريقة معينة في الرؤية والاستشعار للعام المحيط؛ فهي مظهر من مظاهر 
المعرفة الخاصة. وكما نوقش في الفصل الثامنء تثير البيانات الصغيرة الموسعة والبيانات 
الكبيرة وآليات التحليل المرتبطة بها تساؤلات جوهرية بشأن تنظيم وممارسات العلوم 
(Floridi 2012)‏ مع العديد من المقترحات التي توحي بالدخول في نموذج علمي جديد. 
ونتيجة لذلك» لا يتطلب التصدي لطوفان البيانات مجرد فكر جديد حول طرق التحليلء 
ولكن تفكيراً Gs‏ فيما يتعلق بفلسفة العلوم )2012 (Leonelli‏ ويستدعي «y‏ كبير من 
هذه المهمة التفكير النقدي ف التأطير الواسع للتحليلات وآليات الطرق وال مناهج المحددة. 
والتفكير في كيفية إنتاج آليات التحليل الجديدة أنواعا معينة من المعارف والرؤى للعام 
المحيط بناء ومن ثم العمل على معرفة عمل هذه المعارف الجديدة ف els]‏ متضمنا 
ذلك نمذجة كل الأشياء JI‏ | تر إليها )2013 ‘Beer and Burrows 2013; Ruppert‏ 
انظر الفصل الحادي عشر). وبعبارة أخرى. هنالك حاجة ملحة وبصورة عاجلة للبحوث 
الفنية والفلسفية فيما يتعلق بآليات التحليل الناشئة من أجل استشعار البيانات ال موسّعة 
والبيانات الكبيرة. 
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المبررات الحكومية والتجارية للبيانات الكبيرة 


(The Governmental and Business Rationale for Big Data) 


لم تتكشف ثورة البيانات دون فكر وبطريقة مجهولة» LSS‏ هو حال الثورات الأخرى: 
جرى الدفع بها بسبب مجموعهة قوية من الحجج:ء والتمهيد لها من قبل مجموعة من 
المتحمسين ال مؤمنين بفوائد الطرق الجديدة للمعرفة والتعامل في هذا العالم وتحالف 
أصحاب المصالح الخاصة الذين يجنون الأرباح من ظهورها. وف حين أن الحجج التي 
اشتخد ت أن كول وعة جداء وغالًا e. Lis ls‏ ات هيز a‏ إلا أنها 
تشكل ف مجموغها ما أطلق عليه )1977( Foucault‏ مصطلح نظام الخطابة والمجادلة. 
أي مجموعة من النقاشات المتداخلة التي تبرّر وتغذي التطورات الجديدة وتعمل على 
تطبيعها واستنساخها وإعادة استخدامها. فهذا النظام الخطابي يقدم الأساس المنطقي 
لتبني الأفكار والتقنيات الجديدةء وإضفاء الشرعية على مساعي تطويرها وسبل تنفيذها. 
وتدعو النقاشات المستخدمة ف النظام إلى الترويج لرسالتهم وجعلها قناعة dole‏ لترغيب 
الناس والمؤسسات باعتناق منطقهم. وإلى الاعتقاد والعمل فيما يتعلق بهذا المنطق 
.(Dodge and Kitchin 2005)‏ كما عملت على إنتاج أجواء معينة يتم من خلالها 
"تغذية أنواع خاصة من الفكر والممارسة بحيث تبدو طبيعية ومرغويًا فيها" Amin and)‏ 
(Thrift 2013: 5‏ وهی تغرس نوعا خاصًا من الاستجابة العاطفية )2009 4110615011 ). 
فمثل هذه الخطابات والأجواء سعت إلى L el‏ 83 صياغة العام وفق رؤية خاصة» وإعادة 
تشكيل "القضاياء cde JI‏ المخاطرء المصالح» والرغبات التي تنتشر في الحقل السياسي 
وامشهد الاقتصادي )4 :2013 (Barnett‏ 

وكما 5 النقاش في الفصلين الثاني والثالث» فقد سعت نظم الجدال وال محاورة المتداخلة 
إلى الدفع بعمليات تطوير البنى التحتية للبيانات والبيانات المفتوحة مستخدمة النقاشات 
واطداولات حول Jols‏ ومشاركة السانات. واستنساخها وإعادة استخدامهاء وحرية النفاذ 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة:» والبنى التحتية للبيانات» والنتائج المترتبة عنها 1“ 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل السابع 


والوصول إليهاء والحكومة ال مفتوحة. والشفافية. وا مساءلة؛ وتنظيم المشاريع الاجتماعية؛ 
واقتصاديات السعة ووفورات حجم الإنتاج. وكما تم بيانه في هذه الحالات» فإن منحى 
النقاش وطريقة التداول قد تكون مدفوعة من قبل مجموعة من الأطراف ال معنية التي قد 
تستخدم الحجج نفسها ولكن لتحقيق مرام مختلفة (على سبيل المثالء تستخدم منظمات 
المجتمع المدني وقطاعات الأعمال الكبيرة خطابات الشفافية والمساءلة لإتاحة بيانات الحكومة 
وفتحهاء ولكن أحدهما لأسباب مدنية والأخرى للانتفاع ا مالي من البيانات). فالأنظمة 
الخطابية إذا م تكن حصرًا نتاجًا US$‏ من الدول أو الأعمال» ولكنها انتشرت وسنت من 
خلال العديد من القنوات الأصغر .(Foucault 1977, 1978) lea‏ وقد جرى قبولها دون 
إشكالية من قبل الجماهيرء من ال مواطنين والمؤسسات الذين كان من السهل استمالتهم 
من خلال منطقهم. وبالأحرىء» فإن الخطابات مفتوحة للتحديء والرد عليهاء ومقاومتهاء 
وتفنيدهاء ومخالفتهاء والتصدي لهاء وإظهار عوارهاء وتقديم رؤى بديلة جديدة: وفي كلتا 
الحالتين» يستند المرؤجون أو المعارضون لرؤى جديدة على السجل الزمني الممتد من الماضيء 
إلى الحاضرء وحتى ال مستقبل لدعم حججهم» وذلك باستخدام UYI‏ والشواهد من جولات 
سابقة من التغير الاجتماعي والاقتصاديء إلى جانب التحديات الحاضرةء والتكهنات حول 
الكيفية التي يمكن أن تشكل الكيفية التي ستكون عليها الأمور خلال سنوات قادمة: في 
ظل سيناريوهات مختلفة. )2012 ,2011 (Kinsley‏ ومن «e‏ جرى تداول المشهد alas)!‏ 
عبر جولات من التفاوض باسم الصراع على الأفكار والسبل لهيكلة وتمثيل وعمل وتنظيم 
المجتمعات. في الحاضر وال مستقبل. 

وف هذا الفصلء سيجري دراسة col; «Ll‏ المنطقية للبيانات الكبيرة للجهات الحكومية 
وقطاع الأعمال. وقد تم تنظيم النقاش حول أنماط خاصة من النظم والأنشطة الاجتماعية 
بدلا من تنظيم الفصل بحسب مختلف الخطابات التي يشيع توظيفها للترويج لإشاعة 
اعتماد البيانات الكبيرة على سبيل «JULI‏ التبضّر والحكمة. الإنتاجيةء القدرة التنافسية: 
الكفاءة. الفعالية. الفائدةء الاستدامةء والتوريق ا مالي .(Securitization)‏ فالخطب 
تمتلك تأثيرها الأقوى عندما يجري تعبئتها وتوجيهها في مهام وقضايا معينةء والمثير في 
حالة البيانات الكبيرة هو ان جدالها ae‏ إلى جميع القطاعات والشرائح - الاجتماعية. 
والسياسية» والاقتصادية» والبيئية؛ فهي واعدة من خلال تقدممها وسائل جديدة US‏ في فهم 
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وإدارة جميع جوانب حياة الإنسان. وهناء سيتم مناقشة هذا الوعد فيما يتعلق بأربع 
مهام رئيسية هي: حكم الناس وتنظيمهم» وإدارة ا منظمات: وتعزيز القيمة وإنتاج رأس 
امال وأخيرا إنشاء أماكن أفضل. وهذه مهام توضيحية Mal‏ على سبيل الخصر وليست 
شاملة» حيث إن هناك العديد من التطبيقات الأخرى الممكنة: Le‏ في ذلك القضايا البيئية 
(انظر Mayer-Schonberger and Cukier 2013; Siegel 2013; Smolan and Erwitt‏ 
2012(. وستتم مناقشة كيفية إعادة تشكيل البيانات الكبيرة للبحوث في الفصل التاليء كما 
سيجري مناقشة الدعوات ال مضادة لتطبيق البيانات الكبيرة في الفصل العاشر. 


(Governing People) الشعب وتنظيمه‎ eS 
التنوير سعت,الدولة لإنشاء‎ pas الدولة هى مولدٌ ومستخدم رئيس للبيانات» فمنذ‎ 
طرق أكثر منهجية. من جهةء لإدارة وحكم المجاميع السكانية: ومن ناحية $52« لتقديم‎ 
الخدمات للمواطنين. فإحدى هذه الطرق الرئيسية التي هدفت من خلالها إلى أداء هذه‎ 
الأدوار بكفاءة وفعالية كانت من خلال التدقيق والتقدير الكمي والنوعي للمجتمع - أي‎ 
بناء معرفة مفصّلة لإنفاذ ولايتها القضائية والاختصاصية من خلال تطوير النظم الإدارية‎ 
تعمل على قياس وتتبّع فهرسة‎ degia على نطاق واسع» بدعم من أجهزة فنية وتقنية‎ 
Alonso and وتمييز السيانات عن الأفراد. والشركات» واممؤسسات» وا مكونات الأخرى (انظر‎ 
Starr 1987; Barnes and Hannah 2001; Desrosiéres 1998; Kitchin and Dodge 
وإدارةء 325255« وتحليل البيانات من اللهام الرئيسية‎ e 3l إن‎ (2011; Porter 1995 
في جميع مؤسسات الدولة. فهي تستخده في تقييم الالتزامات والاستحقاقات للموضوعات‎ 
والتهرب»‎ «JUSSI السيادية وغير السيادية. والكشف والمراقبة عن الخروقات وعدم‎ 
فعلى‎ .(Rose 1996) والغشء فيما يتعلق بامعايير والالتزامات القانونية المعمول بها‎ 
يتم في الدوائر الحكومية. وخاصة تلك المتعلقة بالتمويل والتجارة والرعاية‎ JELI سبيل‎ 
الاجتماعيةء تحديد جميع المواطنين والكيانات وتتبعهم» ورصد القضايا والاتجاهات من‎ 
خلال التحديثات على سجلاتهم» وتعيين ملفاتهم التعريفية وربط بياناتها بهم» وتعقب‎ 
المدفوعات. وإدارة انضباطهم والخدمات المقدمة لهم. أما في المدارسء فيؤخذ التسجيل‎ 
لبياناتهم» واحتساب وتقييد الدورات الدراسية وعلامات الاختبارات» ويتمٌ مكافأة الطلاب‎ 
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ومعاقبتهم وفقا لأدائهم وسلوكهم. وف قطاع الصحة. يتم قياس حالة ا مريضء وتسجيلها. 
والعمل على أساسهاء واحتساب وتقييم أداء المرافق الصحية. كما تعنى وكالات حكومية 
متخصصة أخرى بإنتاج وإدارة وتحليل ونشر البيانات التي لها بالغ الأثر في إفادة العمل 
الحكومي. على سبيل I‏ مثال» الوكالات الإحصائيةء وهيئات المسح ورسم الخرائط الجغرافية 
وأجهزة الاستخبارات التي تتعهد ببرامج مستمرة لإنتاج البيانات من خلال أنظمة قياس 
مثل المسح واممراقبة. 


ولتعزيز ممارساتها الحسابية» سعت الدول» من جهه. لتبرير وترشيد نظمها وعملياتها 
على الموضوعات,ء ومن جهة 5,51« لتطبيق وسائل إدارية أكثر تعقيدًا وتفصيلا من أي 
وقت مضى )2001 .(McNay 1994; Miller‏ فالمسعى الأول يشمل الخطابات حول 
الحكومة الفعالة والقيمة مقابل «JU.‏ واطواطنة والتمكينء والعدالة ومكافحة الجرمة 
والأمن والسلامة» والتي تتماشى مع فكرة تناول ال مشاكل والقضايا العامة من خلال ال منطق 
الجماعي والمبادئ المشتركة. وتجابه هذه الخطابات من قبل أولئك الذين لديهم الرغبة في 
تقليل مستوى رقابة الدوله وسلصطتها مقابل الحريات الشخصية. والرقابة والضبط للنظم 
ا مجتمعية والاقتصادية» أو أن تكون أكثر انفتاحا واستجابة وإنتاجية في ال ممارسات الحكومية 
متضمناً ذلك إتاحة البيانات التي يحملونها بشكل أكبر وأكثر حرية (انظر الفصل الثالث). 

Ul‏ المسعى الثاني فيتضمن تنفيذ أنظمة وتقنيات وبنى تحتية مصممة لجمع ومعالجة 
البيانات على نحو فعال وأكثر تطورًا من أي وقت مضىء متضمنا ذلك الأنظمة الأكثر ثبانًا وقدرة 
في التعريف والتحديد (التواقيع والصور وبصمات الأصابع» وأرقام الضمان الاجتماعي وجواز 
السفرء وقوانين الضرائب» وأرقام الترخيص والحسابات» وال معلومات البيومترية» والمستخدمين 
وكلمات السر والرموز البريدية... إلخ)» والتي يمكن تشغيلها على نحو متزامن بشكل متزايد 
وعن بعد )2005 «adeg (Dodge and Kitchin‏ يؤكد )178 :1997( Hannah‏ على أن أحد 
أشكال الحاكمية الأكثر فعالية يكون في الغالب من خلال تكوين "لفيف معقد من مجموعة 
بسط النفوذ والهيمنة...من خلال التعدادات والبيروقراطية والسياسات. وما إلى US‏ وكم 
هائل من اممؤسسات التخصصية Jio‏ المدارس وأماكن العمل» والأراضي ال ممتدة المجهولة المثبتة 
ملايين من نقاط الانطلاق كأجهزة الصراف «MI‏ وكاميرات المراقبةء ونماذج تعبئة الطلب". 
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ولذاء فإن البيانات الكبيرة بأحد معانيها ليست شيئا جديدًا على الدول - وهي التي 
تعاملت طويلا مع كميات هائلة من البيانات في إدارة الاختصاصات القضائية والقانونية 
كجزء جرى معالجته واتخاذ الإجراءات المتعلقة به في الوقت ا مناسب ف auo‏ أو قريبًا منه 
كلما تفاعلت الوكالات مع الموضوعات. ومع ذلكء ينظر إلى البيانات الكبيرة باعتبارها أحدث 
مجموعة من التقنيات التي يمكنها توسيع وتحسين عمل الدول من خلال زيادة الانضباطية 
والشمولية للممارسات الحسابية لأعمالها. كما يتبنى البائعون» في بعض الحالات» خطاب 
الدفع بحلول البيانات الكبيرة بهدف بيع خدمات الدولةء وف حالات أخرىء تأخذ الدولة 
بزمام المبادرة بشكل نشط. وف الوقت الحاضرء هناك نوعان من الإستراتيجيات الخطابية 
الرئيسية ال مستخدمة لتشجيع استخدام البيانات الكبيرة في السلطات الاختصاصية. يتعلق 
النوع الأول بالتحسينات على الإدارة العامة وتقليل التكاليف من خلال تعزيز الكفاءة 
التشغيلية» وتقليل تكلفة الأخطاء والاحتيال في إدارة المنافع» وزيادة في الإيرادات الضريبية 
عن طريق تضييق الفجوة الضريبية... وتحسين تخصيص التمويل ف البرامج والخدمات ذات 
الجودة الأعلى» وزيادة المساءلة في القطاع العام: وإطلاع أفضل للمواطنين", مع تقديرات 
مقترحة بعائدات لحلول البيانات الكبيرة من الكفاءة التشغيلية المتعلقة بإدارة القطاع العام 
à‏ القارة الأوروبية تعادل مئة وخمسنن مليار دولار Manyika et al. 2011: 61,) Kyl‏ 
62(. وسيجري لاحقا مناقشة هذه الحجج بشكل xS]‏ فيما يتعلق بإدارة المنظمات وصنع 
أماكن أفضل. 

ويهتم النوع الثاني بأمن الدولة ومكافحة الجرهة»ء إذ تقوم جميع الدول باممراقبة 
والرصد لأغراض الأمن والسلامة ومنع الجريمة والاعتقال من خلال أجهزة الشرطة وجمع 
المعلومات الاستخباراتية على نطاق أوسع. وقد تم تطوير الكيفية التي تنفذ بها هذه 
الأنشطة ما يتماشى مع التقنيات الجديدة - كالتنصت على ال مكال مات الهاتفية واعتراض 
الموجات الراديوية» والدوائر التلفزيونية المغلقة: والتصوير الجويء وصور الأقمار الصناعية, 
ومراقبة الإنترنت - والتي كثيراً ما جرى التبرير لها عند وقوع أحداث رئيسية مثل الحرب 
الباردةء والحوادث الإرهابية )2001 (Innes‏ وف الآونة الأخيرة. قذمت أحداث الحادي 
عشر من سبتمبر وما تبعها من الحرب على الإرهاب jl‏ المنطقي لتغيير جذري في عمليات 
ا مراقبة والتأمين التي تقودها الدولة على نطاق واسع )2006 .(Amoore‏ وكان Ule‏ لبعض 
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الوقت أن تحليلات البيانات الكبيرة كانت عنصرًا أساسَيا في تحسين هذه الأنشطة. وخاصة 
فبما يتعلق döl e‏ الحدود وفحص الهيحرة Kitchin and Dodge 2006; Clements)‏ 
2013(. وقد كشفت تسريبات يونيو 2013 بشأن برنامج وكالة الأمن القومي الأمريي 
بريزم gabl (PRISM)‏ الذي وصلت إليه ممارسات مراقبة البيانات» وممارسات البيانات 
الكبيرةء والآليات التحليلية ا مستخدمة لجمع ومعالجة البيانات المتعلقة بالاتصالات اليومية 
لجميع المواطنين مثل المكامات اليوميةء الرسائل النصية: رسائل البريد الإلكتروني» واستخدام 
الإنترتت: ندلا من اقتضارها غلى المواطتن الأعانب والقوى الخازحية أو لأهداف مخددة 
.(Greenwald and MacAskill 2013; Risen and Lichtblau 2013)‏ فهذه التسريبات 
كانت هي الأحدث في سلسلة الكشف عن تجسس الولايات المتحدة على مواطنيها بشكل 
.(Solove 2007 ; Bamford 2009) „å>‏ والواقع› أن من الواضح أن الوكالات الاستخبارتىة 
والمتعاقدين العسكريين-الصناعيين» هم في طليعة مطوري الجيل القادم من أدوات البيانات 
الكبيرة لإدراك الكميات الهائلة من البيانات عالية السرعة. وقد استثمرت بكثافة في بناء 
الكفاءات والتقنيات واطرافق على سبيل «JULI‏ جرى استثمار 1.7 مليار دولار آمریک في 
مركز البيانات القائم في يوتا معالجة وتخزين البيانات الكبيرة التي تم جمعها من الولايات 
(Carroll 2013)‏ وبينما تسعى الدول إلى ترشيد تلك المراقبه ذات النطاق الواسع على 
مواطنيها من خلال الخطابات العامة الموجهة للأمن والسلامة. فإن الحقيقة المائلة هي 
أنها قد طوعت الكثير من أجهزتها سرا لتنفيذها ودون اتباع للإجراءات القانونية الواجب 
العمل بها مما يقوض امثل العليا للدمقراطية القانئمة على الشفافية والثقة Clements)‏ 
2013(. ومع ذلك» فمن غير ال مرجح على المدى القصير أن يقوم الغضب الشعبي العارم على 
هذه ال ممارسات والتجاهل الصارخ للحقوق الأساسية مثل الخصوصية: على إبطاء أو إعادة 
تشكيل طريقة التعامل مع البيانات الكبيرة في هذا الجانب من الحكم ولا لثني الخطابات 
التى استخدمت لتبريرها. 
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:(Managing Organisations) ادارة المنظمات‎ 

تماما كما تغيرت الدول وتفرعاتها الكثيرة في الحكم كالإدارات. السلطات المحلية: 
الوكالات» الجيش» مقدمي الرعاية الصحية... إلخ مع مرور الوقت» واعتمادها ممارسات 
وتقنيات إدارية جديدة لإعادة تشكيل الكيفية التي يجري بها تنظيمها وتشغيلهاء «Jib‏ 
قامت شركات الأعمال والكيانات المؤسسية الأخرىء مثل ال منظمات غير الحكومية والهيئات 
التطوعية وا مجتمعية: والجمعيات الخيرية: والأحزاب السياسية... إلخ. فالبيانات المتعلقة 
بمهامها الأساسية تشكل أحد الجوانب الأساسية لكيفية فهم هذه المنظمات لنفسها ودوائرها 
الانتخابية:. وكيفية اتخاذ القرارات بشأن عملماتها الحالية والمستقبلية. كما أن السانات 
تقذم الإثبات والدليل للإنتاج المعرفي الذي يستخدم لإدارة ا منظمة بشكل أكثر كفاءق 
وفعالية» وتنافسية» وإنتاجية» وتحديد المنتجات والأسواق الجديدة (انظر القسم التالى). 


وهكذاء أصبحت نظم ال معلومات على مدى السنوات الستين الماضية من البنى التحتية 
الأساسية لجميع المنظمات على اختلاف أحجامهاء مما يمكنها من تتبّع وإدارة المجاميع البشرية 
المعقدة كالموظفينء الداعمينء المانحين» والعملاء» «css ls‏ والسلع الأساسيةء والبنى التحية 
عبر الزمان واممكان» وتمكينها من توسيع نطاق عملياتها من ال مستوى المحلى إلى المستوى العاممي 
(Castells 1996; Dicken 2003)‏ فنظم ال معلومات تتيح تشغيل المنظمات بشكل اكثر ذكاء 
وإنتاج وفورات كبيرة من تكاليف قاعدتها التشغيلية. وهناك ثلاثة من هذه النظم المعلوماتية 
ا مبنية على البيانات والتي تم اعتمادها على نطاق واسع: نظم تخطيط موارد ال منظمات (ERP)‏ 
ونظم إدارة سلسلة التوريد (SCM)‏ ونظم إدارة علاقات العملاء (CRM)‏ وتسهل هذه 
الأنظمة قدرًا أكبر من التنسيق والضبط داخل المؤسسة: ومع ا منظمات الأخرىء والعملاء. على 
سبيل «JUL‏ ينظم ويجمع نظام تخطيط موارد المنظمات العديد من قواعد البيانات والأنظمة 
امتعلقة بالشراء التخزينء الجرد» «JI‏ التسويقء ال محاسبة. إدارة شؤون الموظفين وإعداد 
قوائم المرشحينء إدارة المشاريع: والعلاقات مع العملاء في نظام واحد شامل يضمن بصورة 
سهلة وتلقائية توافر السانات والعمليات من جزء واحد من الأعمال لجزء آخر Dery et al.)‏ 
Grant et al. 6‏ :2006). كما تستخدم نظم إدارة سلسلة التوريد (SCM)‏ بأكبر قدر 
من الكفاءة لتنظيم المشتريات. والحركةء وإدارة وتخزين المواد من الموردين من الشركة وحتى 
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الزبائن )2012 (Chopra and Meindl‏ في حين تسعى نظم إدارة علاقات العملاء (CRM)‏ 
إلى بناء علاقات شخصية مع العملاء من خلال جمعها أنماط الحجوزات والمشتريات السابقة 
لهم» وعرض التفضيلات والخدمات ال ممكن الاستفادة منها خلال زياراتهم: والاستفادة منها ق 
تقديم مكافآت الولاءء والعروض الخاصة:؛ والترقيات» وتقديم التوجيهات للموظفين والأنظمة 
ليظهروا مظهر العارف بالعميل )2005 .(Sigala‏ وقد أكد )2011( Brynjolfsson et al.‏ من 
خلال دراسة شملت 179 شركة من شركات التداول العام الكبيرة على اعتماد هذه الشركات فى 
اتخاذ القرارات .42 على البيانات Ca» (Data Driven Decision- DDD)‏ يكون الناتج 
والإنتاجية أعلى Us‏ يراوح بين 7-0 X‏ عما هو متوقع عند الاعتماد على استثماراتهم الأخرى 
وطرق استخدام تقنية المعلومات. 

وينظر إلى البيانات الكبيرة من قبل العديد على أنها المرحلة التالية في العملية الجارية 
التي تسعى إلى الكفاءة التنظيمية والبنى التي تعزز الميزة التنافسية» مع الحد من المخاطرء 
والتكاليف. والخسائر التشغيلية» وتحسين تجربة العملاء. فالذي توفره البيانات الكبيرة هو 
الإمكانية الشاملة وال مفصلة لغاية إدراك جميع جوانب عمل المؤسسة بشكل آني ولحظي. 
وكما افترضت جماعة الضغطء. مؤسسة تك أمريكا ):2012 TechAmerica Foundation‏ 
12( فإن البيانات الكبيرة ستضع الأساس: لاستبدال أو دعم عمليات اتخاذ القرار البشرية 
بخوارزميات آليةء مما يعمل على الحد من أوجه القصور داخل المنظمات؛ ويوجد الشفافية؛ 
ويحسن الأداء من خلال تمكين التجريب لاكتشاف الحاجات وإظهار التباينات؛ وتحسين العائد 
عن الاستثمار (ROI)‏ لاستثمارات تقنية ا معلومات. وتحسين عملية اتخاذ القرار والتشغيل 
الذى؛ وتوفير قدرات تنبؤية لتحسين مخرجات المهام؛ والحد من التهديدات الأمنية والجريمة؛ 
والقضاء على الهدرء والاحتيالء وإساءة الاستخدام والمعاملة؛ وابتكار نماذج أعمال وخدمات 
مستفيدين جديدة. 

وبعبارة أخرى» ستوفر البيانات الكبيرة معرفة لحظية غاية في الدقة المفصّلة لكبار 
oo‏ في جميع مناحي منظماتهم والتي يمكنهم من خلالها صباغة دورات عمل محكمة. 
وستمكن التنانات ]85457 اللتظمات من أن تكون 351 فظنة: وملامة: 13529« ومتكرة: 
وذكية في كيفيه تنظيمها وتشغيلها )2011 (Manyika et al.‏ 
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ومثال على كيفية التوظيف الناجح للبيانات الكبيرة من قبل منظمة غير تجارية 
لإعادة هيكلة وإدارة عملياتها الحملة الانتخابية لباراك أوباما عن الحزب الديمقراطي. 
فكما أشرنا في الفصل cl JI‏ فقد تبنت الحملة الانتخابية لأوباما البيانات الكبيرة» من 
خلال جمع مجموعة هائلة من البيانات من مصادر متعددة وإنتاج بيانات اقتراع معتبرة 
لحظيا في الوقت المناسبء من أجل إدارة 3 الفعل: وتشكيل الإستراتيجية: والإجراءات: 
ومهام العاملين والمتطوعين. واستنادًا إلى تحليل الأداء عام Y * «A‏ فقد نمت مجموعة 
تحليلات البيانات للحملة الانتخابية لأوباما للعام ۲١٠۲‏ في الحجم خمسة أضعاف عنها في 
حملة ۲٠١۸‏ متضمنة روادا تقنيين جرى التعاقد معهم من سوق الصناعة )2012 (Scherer‏ 
وقد حسّنت هذه ال مجموعة العلائقية بين البيانات التي تم جمعها من مصادر مختلفة 
بحيث أمكن ربطها معا بشكل أكثر فعالية. كما طوّروا تطبيقات للحملة الانتخابية» وجرى 
استخدام شبكات التواصل الاجتماعى مثل فيسبوك للدفع باتجاه التسجيل للانتخاب 
والحصول على التضويت لصالحهاء وتشيت ملفات تعريف الارتىاط (Cookies)‏ الخاصة 
بهم els‏ المتعلقة بأطراف تم التعاقد معها على أجهزة الزائرين طوقعهم الإلكتروني 
لجمع البيانات عنهم وتتبع عاداتهم على الشبكة )2012 (Crovitz 2012; Kaye‏ 
كما قاموا بتحسين تصنيفاتهم التعريفية وتوقعات النماذج التنبئية وكيفية استخدام 
المعلومات الناتجة عن تحليلاتهم لتوجيه الحملة» بالإضافة إلى اختبار وصقل طرق زيادة 
التمويل لدعم الحملة مالا )2012 .(Scherer‏ كما أضافوا وعالجوا السانات الجديدة 
بشكل مستمر مع تشغيل لأنظمة ال محاكاة للتنبؤ بالنتائج وأفضل الردود. وكما صرّح 
أحد 195.5( الحملة: "لقد شغلنا نموذج المحاكاة 77,0٠٠‏ آلف مرة في كل ليلة" لتحديد 
احتمالات الفوز في كل ولاية متأرجحة". وفي كل صباح يصل إلينا الناتج» هذه هي فرص 
نجاحكم في الفوز في هذه الولايات» وبهذه الطريقة تم تخصيص اموارد (مقتبس عن 
.(Scherer 2012‏ لقد حصل فريق أوباما على مزايا مهمة عن منافسيهم من خلال 
التشغيل مستمر مجموعات قواعد البيانات المتغرة من خلال خوارزميات متطورةء 
adeg‏ أشار )246 :2012( Issenberg‏ إلى أن حملات أوباما الانتخاسة كانت "ال مجموعة 
RES‏ التفسسية Adel‏ عند القافة عل E E‏ وا اة áo sexi‏ 
الصارمة "» وهذا هو وعد ölel‏ للبيانات الكبيرة بأن الفوائد العائدة عنها كالتي اكتسبها 
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الحزب الدمموقراطي من البيانات الكبيرة» لها أن تتحقق لجميع المنظمات وغيرها من 
شركات قطاع الأعمال. 
تحصيل القيمة وإنتاج (Leveraging Value and Producing Capital) JUI wlj‏ 
فضلا عن جعل الشركات أكثر كفاءة وفعالية ف إدارتهاء يتم الترويج بكثافة للبيانات 
الكبيرة لتكون وسيلة لرفع مستوى القيمة الناتجة من أنشطة الشركة وعلاقاتها مع الموردين 
والمستهلكين. وف الواقع: وكما أشار )2011( «Gantz and Reinsel‏ فإن المحرك الرئيسى 
للبيانات الكبيرة ليس تقنيًا؛ ولكنه مالي مع الوعد بالمزيد من الكفاءة والأرباح. ومن ثم 
فإن اعتماد حلول البيانات الكبيرة هو إستراتيجية لإدراك تراكم رأس امال غير المستغل 
بطريقة تقدم عائدا کا من الاستثمار وتوفير ميزة تنافسية );2011 Manyika et al.‏ 
.(Zikopoulos et al. 2‏ وهناك العديد من الطرق التي يمكن من خلالها لحلول 
البيانات الكبيرة أن تضفى الذكاء للشركات وبطريقة هكن معها أن تنمو مبيعاتها وأرباحها. 
فمع الأخذ لقطاع البيع بالتجزئة كمثال. حدد )2011( Manyika et al.‏ ستة عشر حلا 
مقسّمة إلى خمسة أنواع - التسؤيقء والترويج» والعمليات» وسلسة التوريدء ونماذج الأعمال 
الجديدة - ممكن لكل منها تحصيل مكاسب محتملة 3 مجال امميعات والكفاءة (انظر 
الحدول .)۷-١‏ وهي تشمل إنتاج بيانات عير الشركة وتطبيق البات التحليل من أجل 
تقسيم السوقء والتصدى لعزوف العملاء «(xb sls‏ وتحسين المدخلات المختلفة (على 
سبيل JULI‏ المكوناتء والعمالة» وال مرافق) وتؤدي من ثم إلى بناء مختلف التشكيلات 
والنماذج التنبئية للإجابة عن مجموعة متنوعة من الأسئلة من قبيل: 
e‏ هل يتم الاتصال بالعميل el‏ لا (التسويق ا مستهدف)؟ 
٠‏ هل يتم تقديم عروض للاحتفاظ بالعميل el‏ لا (المحافظة على العملاء)؟ 
٠‏ أي نوع من الإعلان أو اختيار الكلمات / الصور أو exl!‏ تقدم للعميل (انتقاء ال محتوى)؟ 
o‏ أي قناة ينبغي الاتصال من خلالها بالعميل (اختيار القناة)؟ 
e‏ هل بتم تقديم عرض del‏ أو أقل JC‏ للعميل (التسعير /الخصم امتغير)؟ 
۵ هل يتم شطب جزء اکر من الدين عن المقترض (التحصيل)؟ 
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e‏ هل يتم تقديم حد ائتماني أعلى أو أدنى أو معدل فائدة للعميل (مخاطر الائتمان)؟ 
(Siegel 2013)‏ 

وللتركيز على نوع واحد من أنواع الحلول الخمسة التي قدمها )2011( «Manyika et al.‏ 
وهو التسويق» مكن استخدام عدد من آليات التحليل وأدوات إدارة البيانات الكبيرة 
ا موزعة في أربعة محاور هي: التوحيد والاختزال» التقسيم والتجزئة: ا لمطابقة. والتحسينء 
وذلك لإدارة ومعالجة وتحليل وتفسير البيانات من أجل تلبية الأهداف (انظر شكل (V - ١‏ 
إن هدف التسويق السلوك هو بيع البضائع والخدمات بصورة أكثر فعالية للأفراد والعملاء 
وبناء علاقة طويلة المدى معهم من أجل الحفاظ على عاداتهم وذلك من خلال الانسجام مع 
خصائصهم» وسلوکهم» 375.55( ورغباتهم )2011 501076 .(Schwartz and‏ فمن خلال 
بناء الملفات التعريفية الفردية للأشخاص ودمجها مع التحليلات التنبئية» تسعى الشركات 
إلى تقديم تجربه شخصية من خلال التسويق الجزني للمنتجات والعروض الخاصة. وق 
سبيل US‏ تسعى الشركات إلى توقع نية العميل في الشراء وتسهيل تحقيقهم لهذه النية 
بلطف» مع السعي لبناء ولاء العملاء قي الوقت نفسه )2013 (Minelli et al.‏ وق ذات 
Lx‏ « زعم Bill Stensrud‏ أن "اموزعين يستخدمون البيانات الكبيرة في محاولة للحصول 
على ال مستهلكين" ) مقتبس $ 24 :2010 (Bollier‏ 

وقد تم بالفعل تنفيذ مثل هذا النهج للبيانات الكبيرة من قبل عدد من تجار التجزئة 
مثل وول مارت وتيسكو. حيث تنتج مثل هذه السلاسل من المتاجر كميات هائلة من 
البيانات يوميًا من خلال نظم تخطيط موارد المنظمات (ERP)‏ وإدارة سلسلة التوريد 
(SCM)‏ وإدارة علاقات العملاء (CRM)‏ الخاصة بهاء Le‏ في ذلك ربط منافذ المبيعات 
بالزبائن من خلال بطاقات الولاء والاتتمان ) في حالة وول مارت هناك ما يقارب ۲١۷‏ 
مليون معاملة (bags‏ واستخدامها لوضع إستراتيجيات أفضل للأسعار. ومخططات التخزينء 
وإعداد قوائم ال لموظفينء ومراقبة المخزون: والحملات الإعلانية:ء وتكاليف ال موردء وتحديد 
مواقع جديدة للتخزين وامنتجاتء...إلخ: واقتطاع حصة من سوق منافسيها عند القيام 
بذلك )2010 .(Bollier‏ وعوضًا عن إجراء مسوح عينية ضيقة ودراسات استقصائية باهظة 
التكلفة: لاستطلاع آراء المشاركين عن ماذا سيفعلون: وما هى القيمة المعتبرة بنظرهم تقوم 
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البيانات الناتجة عن العمليات والتصفح على الشبكة بالكشف عن هذه المعلومات عبر 
جميع المستهلكين. فالفوائد المتوقعة مرتفعة. حيث يشير )2011( Manyika et al.‏ إلى 
أن البيانات الكبيرة يمكن أن تزيد هوامش التشغيل لتجار التجزئة بنسبة ٠١0‏ في .3« وف 
حين أن هذه الحلول المتعلقة مبيعات التجزئة والتسويق من ال ممكن أن تتوفر في مختلف 
القطاعات» فإن درجة بروزها يختلف من قطاع لآخر بين مختلف القطاعات الأكثر استفادة 
من حلول معينة (انظر الجدول (V-Y‏ 

(V - ١( الجدول رقم‎ 


أنماط ذكاء البيانات الكبيرة للشركات 


البيع العابر للحدود (باستخدام ال مواقع الجغرافية للزبائن» وتاريخ الشراء 
(Marketing)‏ والتفضلات» وا ملعطيات الأخرى لزيادة متوسط حجم الشراء) 
التسويق القائم على الموقع (باستخدام الموقع الحالي بشكل آني أو «uod‏ 
على سبيل JULI‏ نظام تحديد المواقع الجغرافية في الهواتف ASII‏ 
واستهداف الزبائن الموجودين في المتاجر أو بالقرب منها) 
تحليل السلوك داخل المتاجر (تتبّع الهواتف «JE‏ وسلال التسوّقء والمراقبة 
Ll‏ ,45 للمساعدة à‏ تحسين مخطط توزيع امتجر 939 «bol F‏ ومواضع 
الأرفف )8355 (Cols‏ 
التقسيم الجزني للعملاء (استخدام تاريخ الشراء والتصفح لاستهداف العملاء 
بشكل فردي بالإعلانات والعروض الخاصة) 
لتحديد ميلهم تجاه منتج ما وتعديل الحملات التسويقية بشكل مناسب) 
تعزيز تجربة العملاء مع تعدد القنوات (إنشاء تجارب وفهارس على شبكة 
الإنترنت مصممة بشكل فردي بحسب العملاء) 
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تحسين التشكيلة (تخصيص البضائع لحفظها في أي من المتاجر استناذا إلى ا مواقع 
الجغرافية المحلية» وانطباع المشترين وسلوكهم» والحقائق المحلية الأخرى) 


o À 
" 3 | 
* 


(Merchandising) 


تحسين التسعير (باستخدام السلوكيات الشرائية والجغرافية لاتخاذ قرارات 


التسعير في مختلف اللمواقع لزيادة المبيعات / الأرباح) 
تحسين التموضع والتصميم (باستخدام السلوك داخل المتجر والتفاعلات على 
الموقع الإلكتروني لتوجيه عملية تصميم الموقع / المتجر وأماكن وضع البضائع 
لزيادة المبيعات) 










العملبات 
(Operations)‏ 


شفافية الأداء (التحليل ال مفصّلء بشكل آني أو لحظى على نحو متزايدء لتحديد 
مدى أداء المنتجات» والمتاجرء والموظفين) 
تحسين مدخلات الموظفين (احتساب ال مستويات (JI‏ للتوظيف وجدولة 
المناوبات لتفادي فرط التوظيف أوشح القوى العاملة) 
سلسلة التوريد إدارة ال مخزون (تحسين توقع المخزون من خلال رصد تواريخ الطبيعات. 
(Supply Chain)‏ | ودورات المبيعات الفصليةء والأحداث والظروف ال محلية لضمان مستويات 
مناسبة من ال مخزون ال مطلوب) 
تحسين التوزيع والدعم اللوجستي (تحديد مواقع البضائع بشكل آني أو 
لحظي» واحتساب مسارات الطرق الأكثر ملاءمة وكفاءة من حيث الوقت 
والوقود. ومراقبة سلوك السائقينء وجدولة أعمال الصيانة) 
مفاوضات الموردين (باستخدام البيانات المتعلقة بتفضيلات ال مستهلكين 
ومشترياتهم لإبلاغ مزودي المنتجات) 





نماذج الأعمال خدمات مقارنة الأسعار (تقديم خدمات مقارنات شفافة من أطراف ثالثة 
الجديدة New)‏ للزبائن لأسعار المنتجات بشكل آني أو لحظي عبر مختلف تجار التجزئة) 


Business Models) 


الأسواق القانئمة على الويب (تجار التجزئة الذين يقدمون خدمات بقيمة 
مضافة مثل الوصول إلى الباعة الآخرينء: ومعلومات ال منتجات» واطراجعات 
الناتجة عن المستهلكينء ومقارنات الأسعار) 





.Manyika et al.2011:67-71 المصدر : جمعت من‎ 
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مقتبس من "البيانات الكبيرة: آفاق جديدة للابتكار والمنافسة والإنتاجية"» (معهد 
ماكىنز ي العاممي (May 2011) Mckinsey Global Institute‏ 


.(www.mckinsey.com/mgi.Mckinsey&Company) 


وإضافة إلى الدفع بالفوائد ال متوقعة» سعى دعاة البيانات الكبيرة أيضا إلى دعم اعتمادها 
من خلال تسلبط الضوء على عواقب فشل الاستثمار فيها. على سبيل JELI‏ أشار Manyika‏ 
etal. )2011: 6(‏ إلى أنهم: "يتوقعون أن يرونء عبر القطاعات» تحقق القيمة التي تعود 
على المستخدمين الرئيسيين للبيانات الكبيرة على حساب المتقاعسين lae‏ وبعبارة $55« 
سوف يتخلف أولئك الذين لا يستطيعون التأقلم واعتماد حلول البيانات الكبيرة عن الركب 
ويتعرضون للتعثر والأفول؛ لأنهم سيفقدون حصتهم في السوق. وبغض النظر عما إذا كان 
استخدام الخطابات للدفع أو الجذب» فقد أضحت البيانات الكبيرة للأعمال منتشرة داخل 
التيار الرئيسي ووسائل الإعلام التجارية منذ العام 82012( وبالنظر لفوائدها الموصوفة: يبدو 
أن البدء في تطبيقها على نطاق واسع سيمثل المرحلة التالية للابتكار التقني وذلك بصورة 
ا 
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الشكل رقم (V - Y)‏ 
التسويق والسانات الكبيرة 


أهداف المسوقين قدرة المنصة 


مسارات النقر 
العملىات 
الأحداث 
إدارة علاقات العملاء 
مكالمات الدعم 


CE)‏ نظرة أحادية للعميل 


التوحيد والاختزال 


التكتل /التجميع 

حيازة البياناتٌ 

اختيار الخصائص 
الربط 


ع 





الرسائل الشخصه 


sac. $4 ae O) 
تجزئة القيمة الأحادية‎ 3 





التنبؤ 
خوارزميات التنبؤ 


الربحية العالية للحملة p‏ شجرة القرارات 
Tfj‏ الانحدار الخطي 


امصدر: مقتىس من 2012 .Claverie-Berge‏ 
تم إعادة الطباعة بإذن من المؤسسة الدولية لآلات الأعمال. © المؤسسة الدولية لآلات الأعمال 


International Business Machines Corporation) 
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الحدول رقم (V - Y)‏ 
فوائد البيانات الكييرة لعشر صناعات مختارة 


تحديد التصرف القادم الأمثل 


المراقبة المتقدمة للحالة 


مطالبات الضمان الغش ف المطالبات 










تحديد التصرف القادم الأمثل 
تحليل سجل النظام 
إدارة مخاطر السيولة 


المراقبة المتقدمة للحالة 





مراقية وتحسين الإنتاج 


تحليلات العداد SII‏ 
التنبؤ بتوزيع الأحمال وجدولتها 
الصيانة بحسب الحاله 


منع الجرائم والتهديدات والتنبؤ بها 
تحليلات JUz- VI‏ والنفايات وإساءة المعامله 


التدبير والتصرف بناء على الصحة العامة 
للمجتمع 
إشراك المستهلكين في رعايتهم الصحية 


التحسين الآلي للأسعار 
التشكيل ox!‏ 


- ^ |“ بق 


ضمان الخدمة الأفضل 
ذكاء الشركة 


استحداث منتجات وخدمات جدددة 





( CIBM (n.d) el g المصدر: أي‎ 


http://www-01.ibm.com/software/data/bigdata/industry.html 
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إيجاد أماكن أفضل: 

اخترع الناس واعتمدوا على مر التاريخ على تقنيات جديدة صممت لإنشاء الثروة 
وتحسين الحياة اليومية وتعزيزها. وقد أثرت العديد من هذه التقنيات بشكل كبير 
على طبيعة وهيكل وتنظيم Suus‏ الحياة المدنية والريفيةء ف الخدمات الخاصة المقدمة 
والنقلء والاتصالات. وبناء البنية التحتية. فهذه التقنيات تحمل في كثير من الأحيان 
تأثيرات متناقضة وسلبية على سبيل JEI‏ المصانع التي صنعت الثروات» وفي الوقت 
نفسه التلوث البيئي أيضاء أو أن تكون مبالغا فيها بحيث تتجاوز الطاقة الاستيعابية 
على سبيل المثالء الاكتظاظ أو الازدحام المروريء أو تنتج التبعيات التي لا يمكن أن 
تطاق على سبيل JELI‏ المسافات الطويلة بين مواقع السكن ومواقع العمل. إن تقنيات 
المعلومات والاتصالات (تكنولوجيا المعلومات والاتصالات) هي أحدث موجة من الأجهزة 
والبنى التحتية الجديدة التي أضحت جزءًا لا يتجزأ في نسيج البيئة التي نعيش بهاء 
ومعها مكوّن مهم من مكونات منطقها الاستطرادي وهو أنها تعمل على توفير الحلول 
للمشاكل الناجمة عن الذورات السابقة من التنمية التي قادتها التقنية - بحيث تجعل 
منها أكثر كفاءة واستدامةء ونظافة» وأمناء وإنتاجية... إلخ - وكذلك إنشاء طرق جديدة 
ماما للعمل ف العام المحيط. رونتيجة لذلك» تبنت المدن تقنية المعلومات والإتصالات. 
على مدى العقود القليلة الماضية» باعتبارها عنصرًا أساسيًا في إستراتيجياتها الإنمائية 
.(Castells 1996; Graham and Marvin 1996; Kitchin 1998)‏ 

إن مفهوم المدن الذكية هو تجسيد لهذه JI‏ 45$ التي تقودها تقنيات المعلومات 
والاتصالات للتنمية المدنيةء والذي يصف الأماكن التي تتكون بشكل متزايد وتراقب بواسطة 
الحوسبة المنتشرة والحوسبة في كل مكانء ويقود ضبط اقتصادها وإدارتها الإبداع والابتكار 
وريادة الأعمال. من قبل أناس أذكماء. وهذه المدن الذكة مجهزة بشكل مكثف ومكن 
فهمها وضبطها بشكل آني أو لحظي؛ فهي qu‏ وتتبادل» 39 Mad: qua‏ وتعمل على 
.(Kitchin 2014) 8,:5JI 5L JI‏ إن مثل هذه bU JI‏ الكبيرة E‏ فهما شاملا ومتغيرا 
فلا بدقة لهذه المدن والمدخلات للأنظمة التي من شأنها بناء أماكن أكثر ملاءمة للعيش, 
dilg‏ ووظيفية: وتنافسبة. ومستدامة )2013 .(Hancke et al. 2013; Townsend‏ فمثل 


ثورة البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها ۹۷ 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل السابع 


هذه الرؤية للمدن الذكية يجري الترويج لها بشكل كبير من قبل عدد من أكبر مزودي 
خدمات البرمجيات في العام وشركات الأجهزة الرقمية (على سبيل «JULI‏ سيسكوء وآي بي 
«el‏ ومايكروسوفت» وإنتل» وسيمنزء وآوراكل» وساب) والتي اعتمدت بحماس من قبل 
المؤسسات البلدية والوطنية والعابرة للحدود التي تتوقع لتقنيات اللمدن الذكية ان تنتج 
تقدم اجتماعي-اقتصادي وتجدد امراكز المدنية لتصبح مراكز للابتكار والعمل Kourtit et)‏ 
(al. 2012‏ وف حين تم بناء بعض مشاريع المدن الذكية من الألف إلى الياء (على سبيل 
JELI‏ سونغدو (Songdo)‏ أو duso‏ مصدر ((Masdar City)‏ فإن معظم هذه المشاريع 
تدريجية» وتتألف من إعادة تجهيز للبنية التحتية القائمة مع تقنيات رقمية وحلول للبيانات؛ 
OS‏ الوظيفة الرئيسية للبيانات الكبيرة في كلتا الحالتين هي توفير تحليلات بشكل آني أو 
لحظي لإدارة كيفية جوانب وظيفة المدينة وتنظيمها. 

لقد استخدمت هذه اطراقبة واليات تحليل البيانات الآنية واللحظية لعدد من السنوات 
في بعض القطاعات. على سبيل JELI‏ قيام العديد من المدن ببناء أنظمة النقل الذكية 
والتي تستخدم البيانات الناتجة عن شبكة من الكاميرات والنواقل والمتعلقة بحركة ا مرور 
حول نظام ما لتقديم تغذية راجعة مركز تحكم مركزي» وتستخدم مراقبة وتنظيم SI‏ 
وتعديل تسلسل حركة المرورء وحدود السرعة e ssl‏ بهاء وإدارة العقوبات المتعلقة 
با مخالفات المرورية بشكل تلقان .(Dodge and Kitchin 2007a)‏ وبامثلء. فقد ترصد 
وتراقب الشرطة مجموعة من الكاميرات وسجلات الحوادث الحية من أجل توجيه الموارد 
المناسبة لمواقع معينة للاستجابة السريعة وبكفاءة. كما يمكن جمع البيانات المتعلقة 
بالظروف البيئية من خلال شبكة استشعار موزعة في جميع أنحاء المدينة» على سبيل 
ا مثالء قياس وتتبع تلوث الهواءء ومستويات الياهء أو النشاط الزلزالي. وتستخدم العديد 
من الحكومات المحلية نظم إدارية لتسجيل مشاركات الجمهور وتفاعله مع خدماتها. وف 
جميع الحالات تقريباء كانت هذه الأنظمة معزولة عن بعضها البعض وتتعامل مع قضية 
واحدة ويتم التحكم بها من قبل وكالة واحدة. 

وفي الآونة الأخيرة. كانت هناك محاولة لجمع كل هذه الأنواع من المراقبة والتحليل في 
مركز واحد وأن تستكمل بآليات تحليل عامة ومفتوحة على نطاق أوسع. على سبيل JULI‏ 
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eL S‏ مركز العمليات في ريودي جانيروء البرازيل» والذي تم إنشاءه بالشراكة بين حكومة 
المدينة وشركة آي cel y‏ بتجهيز نظام على مستوى كافة أنحاء المدينة حيث يجمع البيانات 
من ثلاثين وكالة معا في مركز موحّد لتحليلات البيانات» ها في ذلك حركة المرور والنقل العا 
والبلدية وخدمات الممرافق» وخدمات الطوارئ» ونقاط جمع بيانات الطقس» وال معلومات 
المرسلة من قبل الموظفين والجمهور عر الهاتف» والإنترنت» والراديو (انظر الشكل 7.2 
2012c‏ 51118613). هناء تعمل الخوارزميات وفريق من dol‏ على dolea‏ 94239)« 
وتحليل» ورصد كمية هائله من بيانات الخدمة dadl‏ جنبا إلى جنب مع البيانات المجمعة 
مع مرور الزمن وكميات ضخمة من البيانات الإدارية التي تم إصدارها على أسس دورية 
بصورة أكبرء وغالبا ما يتم المزج بين مجموعات البيانات معا للتحقيق في جوانب معينة من 
حياة المدينة والتغييرات الحاصلة فيها مع مرور الوقت» وبناء النماذج التنبئية فيما يتعلق 
بالتنمية والإدارة اليومية للمدينة وإدارة حالات الكوارث كالفيضانات. ويكمل هذا عن 
طريق منصة العمليات الافتراضية التي تمكن المسؤولين في المدينة من تسجيل الدخول من 
ا ميدان والوصول إلى المعلومات بشكل آني أو لحظي. فعلى سبيل «JULI‏ يمكن للشرطة 
في مشهد الحادث المروري استخدام المنصة «لعرفة عذد سيارات الإسعاف المرسلة للموقع 
وموعد وصولهاء وتحميل معلومات إضافية على الموقع .(Singer 2012c)‏ وكان الهدف 
امعلن من عمدة امدينةء !55195 بايس «(Eduardo Paes)‏ هو إسقاط الحواجز بين الإدارات 
وضم بيانات كل منها إلى الآخر المساعدة ال منظومة بأكملها (Singer 2012c)‏ كما $529 
تطوير مراكز مماثلة في أماكن 5,21« يصاحبها مجموعة من التطبيقات للمواطنين للوصول 
والاستفادة من بعض مناحي البيانات. 

Ul‏ بالنسبة لأولئك العاملين على تطوير واستخدام آليات تحليل متكاملة وآنية 
لبيانات المدينة» فإن مثل هذه المراكز والتطبيقات توفر وسائل فعالة لاستشعار وفهم 
العيش ف المدينة وإدارتها في الوقت الراهن» وتصوّر وتوقع السيناريوهات ال مستقبلية: 
وإجراء توزيع ال موارد بالاعتماد على الدليل وتسهيل التفكير المترابط عبر الحكومة 
Yag «(Flowers 2013; Kitchin 2014)‏ من اتخاذ القرارات استنادًا إلى الكلام 
المتداول» أو الحدس والظنء» أو المحسوبية: أو Wol‏ دورية / جزئية» فمن الممكن تقييم 
ما يحدث في آي وقت. والرد والتخطيط المناسب له. 
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وعلاوة على ذلك» يوفر استخدام عينات كبيرة وربط أشكال متنوعة من البيانات 
تحليلا أكثر عمقاء وشموليةء وقوة. وقد أصبح من الممكن للدعاة لمثل هذه الأنظمة 
تطويرء وتشغيلء وتنظيم» وخوض غمار الحياة في المدينة على أساس قويء ودليل 
منطقی غير ضعيفء. لا Lo‏ انتقائي مبنى على أاسس إيديولوجية سياسية Flowers)‏ 
73. وهكذاء فثمة من «Jos‏ إن استخدام هذه البيانات الكبيرة سيوفر الأساس 
مدينة أكثر فعالية. واستدامة. وتنافسية: وإنتاحجية» وانفتاحاء وشفافية. إلا أن آخرين 
يحذرون من أن البيانات الكبيرة تشر إلى احتمالات الوصاية Big Brother"‏ "< وأشكال 
الحكم القائم على التقنية .(Technocratic)‏ وخصخصة (Corporatisation)‏ إدارة 
oahl‏ (انظر الفصل العاشر). 


الخلاصة: 

رسم هذا الفصل الدوافع الدعائية للبيانات الكبيرة فيما يتعلق بأربع مهام رئيسية 
هي: حكم الشعبء وإدارة ا منظمات؛ وتعزيز القيمة وإنتاج رأس «JUL‏ وإيجاد أماكن 
أفضل للحياة (حيث سسيجري مناقشة إمكاناتها بالنسبة للعلوم في الفصل التالي). وقد 
Cus‏ المناقشة الكيفية التي يتم بها تأطير البيانات الكبيرة سياسيًا واقتصاديا (انظر الفصل 
الأول) وكيف يتم وضع مجموعة قوية من البيّنات والحجج العقلانية لدعم البدء في 
تنفيذ واعتماد تقنيات البيانات الكبيرة وحلولها. وتتضح قوة الأنظمة الخطابية التي 
يجري بناؤها من خلال النظر في الحجج المضادة - حيث من الصعب أن نقول إننا نريد 
أن نبقى ف حالة أقل pas‏ وحكمة» وإنتاجية: وتنافسية: وكفاءةء وفعاليةء واستدامة 
وأمنا... إلخ. فإذا كانت البيانات الكبيرة تقدم كل هذه الفوائد. فإن دعاة البيانات 
الكبيرة يجدون من غير المنطقي عدم sal‏ قدما في تطوير نظم البيانات الكبيرة ودعمها. 
وبطبيعة Jll‏ فإن الحجج التي قدّمت هي ضيقة وانتقائية وتبتعد عمدا عن تسليط 
الضوء على الآثار السلبية المحتملة فيما يتعلق بالحريات المدنيةء ومراقبة البيانات» والفرز 
الاجتماعيء als‏ البيانات» وانفلات زمام التحكم وفرض السيطرة: والحكم الاستباقي: 
والحكم التكنوقراطي (القائم على التقنية) والخضخصة. وغلق التقنيات وعدم إتاحتها 
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بصورة أكبر (انظر الفصل العاشر). فهذه هي وجهة نظر أصحاب المصالح الخاصةء ولا 
سيما أولئك الذين يسعون لبيع تقنيات البيانات الكبيرة. والحكومات التي تسعى نحو 
رؤية الليبرالية الجديدة للحكم والتنظيم (الليبرالية الجديدة: هي فكر أيديولوجي s‏ 
تأييد الرأسمالية ال مطلقة وعدم تدخل الدولة في الاقتصاد.)» وليست وجهة نظر ال مواطنين 
أو ا مجتمعات التي من الممكن أنها لا تزال من دعاة البيانات الكبيرة والحوسبة في كل 
مكان» ولكنهم يتصورون أن استخدامها سيكون بطرق تحررية» وتمكينيه. وتشاركية مع 
إخضاع التأثيرات الأكثر سلبية للرقابة والتنظيم. 

لقد تميز التحليل المعروض في هذا الفصل بالإيجازء مع توفير dab‏ شاملة لبعض الحجج 
التي تطرح. وما هو مطلوب في الوقت الحاضرء من خلال دراسات الحالة المحددة. هو 
تفصيل وتمحيص للأنظمة الخطابية التي تتكشف ويجري بناؤها. على سبيل المثال» فيما 
يتعلق بالترويج للبيانات الكبيرة في المدن الكبيرة» فهناك حاجة لرسم وتجزثة الكيفية 
التي تروّج بها مختلف الخطابات الداعمة فيما يتعلق بأماكن مخددة من خلال المجلات 
التجارية وامواقع الإلكترونية. والصحف اليومية» وامواد الترويجية للشركات» وسجلات 
الدولةء والبيانات السياسية... إلخ» وتقاطعات الأجندات المختلفة ومصالح ال معنيّين. وهذا 
يحتاج إضافة إلى تحليل الكيفية التي يتم بها التصدي مثل هذه الخطابات برؤى «Ab ao‏ 
وتحليل المعآرضات والتداغل با الحجج الخطابية وتتبعتسلسْل الكيفية التى تحولت 
بها مع مرور الوقت» والتحليل المقارن للمشهد الخطابي عبر مختلف gä‏ أن يصاحبه 
تحليلٌ لآثار الخطابات على تشكيل الكيفية التى يعمل بها المجال في الممارسة والنتائج 
المترتبة على تنفيذ حل البيانات الكبيرة. 

وبالنسبة فيما يتعلق بالنقطة 485.2 بين )2014( Salmon‏ بالتفصيل أنه بمجرد أن يتم 
تطبيق حل قائم على البيانات فإنه من النادر أن يحقق الفوائد التي توقعها ا متحمسون 
والداعمون لذلك الحلء وغالبًا ما ينتج عن الحل مجموعة من القضايا الجديدة. وقال 
إنه توجه لقانون كامبل (Campbells Law)‏ الذي صاغه ble‏ الاجتماع دونالد كامبل 
(Donald T. Campbell (1976‏ ليشرح هذه الظاهرة. فقانون کامبل ينص على: 4 
كلما كثر استخدام أي مؤشر اجتماعي كمي لصنع القرار الاجتماعي» كلما كان الموضوع 
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تحت ضغوط الفساد وأكثر عرضة للتشويه وإفساد العمليات الاجتماعية التي يهدف 
إلى رصدها." أو بحسب صياغة سلمون نفسه: "كلما جرى تشغيل حقل بنظام ما بشكل 
أكبر» أوجد هذا النظام المزيد من الدوافع للجميع (الموظفينء والعملاء والمنافسين) لتغيير 
سلوكهم بطرق منحرفة ضارة - مما يوفر أكثر من الشيء الذي تم تصميم النظام لقياسه 
وإنتاجه. سواء كان لذلك أي قيمة في الواقع أم لا". 

وبعبارة أخرىء يبدأ الناس في اللعب على النظام بعقلانية واعتبار المصلحة الذاتية: 
ولكن في كثير من الأحيان بطرق غير متوقعة لإفساد المقاييسء والخوارزميات» وعمليات 
صنع القرار JDI‏ على سبيل المثالء أشار )44 :1995( Porter‏ إلى أنه "عندما يتم 
الحكم على مديري الأعمال من خلال حساباتهم» فإنهم يبدؤون التعلم على كيفية 
تحسين حساباتهم» Le‏ من خلال بعض الحيل من قبيل تأجيل الصيانة اللازمة وغيرها 
من التكاليف ذات المدى الطويل". ونتيجة لذلكء فإنه في حين مكن أن تتحول LAS‏ 
إدارة وتشغيل المنظمات والحكومة:؛ لتصبح قانمة على البيانات ومقاييس الأداء. فإنه من 
at‏ دحا ت 9175 [BT‏ کی de‏ و46 فق diana VCI iro.‏ من aS lodl‏ 
ليس بالضرورة أن تكون إيجابية في مجملها. 

ولذاء تحتاج دراسات البيانات الكبيرة وآثارها إلى الانفتاح لعرض السياسات والأجندات 
الكامنة للبيانات الكبيرة في مختلف السياقات وتوفير أساس لمزيد من المحادثات ال معيارية 
حول هذا النوع من عوام البيانات الكبيرة التي قد نرغب ف العيش بها. فهذه الأنواع 
من امحادثات هى قيد التطوير في الوقت الحاضرء ويرجع ذلك بشكل 35 إلى حداثة 
التطورات وسرعة وقوعهاء وأيضا بسبب هيمنة الأطروحات المبالغ بها عن البيانات الكبيرة 
ومكائد أصحاب ال مصلحة ال معنيين بها. ومع ذلك» تضل الحاجة قائمة لمثل هذه الأحاديث 
بالنظر إلى أن البيانات الكبيرة تعيد تشكيل الطريقة التي يجري بها حكم الممواطنينء 
وتنظيم المواقع» وإدارة المنظمات» وعمل الاقتصاديات» وممارسة العلوم. 
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The Reframing of Science, Social Science and) 


(Humanities Research 


في حديث مجلة الإيكونيميست ف العام 2010 «e‏ ذكر سنان ارال (Sinan Aral)‏ 
أستاذ إدارة الأعمال في جامعة 55555« أن "الثورات ف العلوم Ú‏ ما يسبقها ثورات في 
القياس" (مقتىس عن 2010 (Cukier‏ إن هذا الفصل يستكشف مدى انطباق ملاحظة 
آرال فيما يتعلق بالبيانات الكبيرة: والبنية التحتية للبيانات» والبيانات المفتوحة: وتأثراتها 
فيما يتعلق بكيفية مقاربة البحوث والاكتشافات الأكادمية من منظور فلسفي ومنهجي. 
وعلى وجه الخصوصء agi‏ هذا الفصل بدراسة كيفية تحدى توافر البيانات الكبيرة والبنى 
التحتية للبيانات إلى جانب الأدوات التحليلية الجديدة للنظريات والعلوم اممعرفية القائمة 
في مختلف التخصصات- الكيفية التي يتم بها طرح الأسئلة وكيفية الإجابة عنها- ويؤدي إلى 
نشوء مخالات وتخضصات جديدة. diag‏ يستكشف هذا الفصل ما إذا كانت التغيرات 
التي تطرأ على الطريقة التي يتم بها إنتاج وإدارة وتحليل المادة الخام للمعلومات وا معرفة 
ستؤدي إلى تغيير جذري في فهم وممارسة المبادئ الأساسية التي تقوم عليها العلوم» والعلوم 
الاجتماعية والإنسانية. وبعبارة 5,51« هل تقود ثورة البيانات إلى نقلة نوعية في المجالات 
الرئيسية للعلوم والبحوث؟ 

Jie‏ النموذج (Paradigm)‏ كما حدده كوهن )1962( Kuhn‏ وسيلة مقبولة لاستجواب 
العام وجمع ال معرفة ال مشتركة بين نسبة كبيرة من الباحثين في اختصاص معين في لحظة زمنية 
معينة. ويتشارك الباحثون العاملون ضمن نطاق هذا النموذج ف فلسفة واحدةء واستخدام 
مجموعة من الأساليب الشائعة» وطرح الأسئلة والإجابة عنها للعمل على بناء المعرفة بصورة 
تدريجية. ومن ثمء فإنهم ميلون إلى تفضيل التصنيفات» والمعارفء والنظريات» والأساليب. 
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والأطر الأخلاقية والعقائدية نفسها أو القريبة من بعضها البعض. ومع US‏ فقد أشار 
كوهنء وبصورة متكررةء إلى بروز طرق جديدة للتفكير تتحدى النظريات وامناهج المقبولة 
وا معمول بها. على سبيل JEBI‏ فإن النظرية النسبية لآينشتاين جابهت» وإلى حد كبيرء حلت 
محل نظرية نيوتن في الفيزياء. وبا مثل» أحدثت نظرية التطور لداروين تغييرا جذريا à‏ 
الفكر النظري للعلوم السولوجيةء كما تحدت المذاهب الدينيه في معتقدات النشوء والخلق. 
وقي كلتا الحالتين» فقد تمسك بعض الناس بالطرق امتبعة في التفكير وتشبثوا بهاء في حين 
انتقل آخرون إلى الفكر الجديدء والذي سرعان ما أصبح الفكر المهيمن. وف بعض ال مجالات 
الأكادمية: هناك القليل من الأدلة على نماذج عاملة: لا سيما في العديد من العلوم الاجتماعية 
ele Jia‏ الاجتماع والجغرافيا البشرية» حيث تم تطبيق مجموعة متنوعة من المناهج 
الفلسفية على سبل JELI‏ الوضعية (Positivism)‏ والظواهرية (Phenomenology)‏ 
والبنبوية (Structuralism)‏ وما بعد البنيوية ...(Poststructuralism)‏ وغيرهاء وقامت 
العديد من هذه المعس كرات النظرية بطرح آراء متعارضة بشأن أفضل السبل لفهم العام. 
s‏ مجالات أخرى: مثل العلوم» كان الاجتماع أكثر على وحدة المنهج العلمي المتبع» معززا 
باختبار الفرضيات للتحقق منها أو نفيها. وهذا لا يعني» مع «US‏ عدم تحول أو تغير 
الطريقة التي تعمل على تصوير ونشر المنهج العلمي بشكل دوريء ووجود بعض النظريات 
المتنافسة فيما يتعلق بشرح ظواهر معينةء فالنظريات oo Sue‏ أن تختلف حول الظواهر 
ولكنها تشترك في نفس النهج الأوسع للمساعي العلمية. 

وقدبين جيم غراي (Jim Gray)‏ على سبيل LS) JUL‏ هو مفصل ف Hey et al.‏ 
2009( تطور العلوم من خلال أربعة نماذج» حيث أشار إلى أن النموذج الرابع ما زال في 
بداياته ولكن هو نتيجه لثورة المعلومات المنتشرة (انظر الجدول 8.1(. وبخلاف طرح 
كوهن» تحدث التحولات ف النموذج لأن النموذج السائد ف العلم لا يمكنه تفسير بعض 
الظواهر ال معينة أو الإجابة عن الأسئلة الأساسية» ومن ثم تبرز المطالبة بإعادة صياغة 
أفكار جديدة: فتحولات غراي تأسست على التطورات الجارية ف أشكال البيانات وتطورات 
الأساليب التحليلية الجديدة. وسيستكشف هذا الفصل إلى أي مدى b‏ وجود النموذج 
الرابع في العلوم.: ü dis‏ مدى تقود ثورة السانات إلى نظريات معرفية بديلة في العلوم 
الإنسانية والعلوم الاجتماعية. وبالنظر إلى المراحل الأولية نسسا في ثورة البيانات المنتشرة, 
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فرما لن blis‏ بتباين الآراء حول تأثر البيانات الكبيرة» والبيانات ال مفتوحة» والبنى التحتية 
للبيانات» وتحليلات البيانات الجديدة على إنتاج نظريات معرفيه جديدة» وسيستمر وجود 
مثل هذه التباين ف الاراء. ولكنء لا مجال للشك ف أن البيانات CII‏ والبيانات المفتوحةء 
والبنى التحتية للبيانات» وتحليلات البيانات الجديدة تطرح قضايا معرفية أساسية وذلك 
لأن استخلاص ال معلومات الصحيحة وال مفيدة من طوفان السانات لا Aso‏ بيساطة قضية فنية 
مكن التعامل معها من خلال حلول 4435 فحسب )2012 (Floridi‏ 

(A - V) الجدول رقم‎ 

نماذج العلم الأربعة 
التجريبية: وصف:الظواه يوقلا | قبل ان النيضة 


الإحصاني والتنقيس عن البيانات 

.Hey et al. 2009 المصدر: تم التجميع من‎ 
:(The Fourth Paradigm in Science) النموذج الرابع للعلم‎ 

x— à‏ أن جيم غراي (Jim Gray)‏ تصور أن النموذج gol JI‏ في العلوم يتسم بكثافة 
البيانات واتساع المنهج العلمي المؤسسء إلا أن بعض العلماء الآخرين يرون أن البيانات 
الكبيرة أفسحت الطريق لبزوغ pac‏ جديد للفلسفة التجريبية (Empiricism)‏ حيث 
مكن لحجم البيانات الذي تصحبه أسالبب معينة أن يكشف عن الحقيقة الكامنة فيهاء وأن 
يمكن البيانات من أن تتحدث عن نفسها وهي متحررة من النظرية. وقد اكتسبت وجهة 
النظر الأخيرة الاعتمادية خارج المجمعات العلميةء وخاصة داخل دوائر الأعمال. ولكن 
أفكارها تأصلت وتجذرت ف المجال الجديد لعلوم البيانات والعلوم الأخرى. فكلا المنهجين 
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يوفران تحديا للمنهجية العلمية التقليدية إضافة إلى طرح نموذج بديل محتملء وفي هذا 
الجزء» سيتم دراسة الادعاءات العلمية لكلا المنهجين بشكل نقدي. 


عودة ظهور الفلسفة التجريسة :(The Re-Emergence of Empiricism)‏ 
بالنسبة للبعضء فإن فلسفة النموذج الرابع هي ما أطلق عليه Brooks (2013 a)‏ 
«منهج البيانات» .(Data-ism)‏ وهو محاولة التقاط sl‏ شىء على شكل Dllo‏ واستخلاص 
مستوى معين من التبصر منها: "فاي شيء يمكن قياسه يجب أن يتم قياسه... البيانات هي 
منظور شفاف وموثوق يسمح لنا بتنقية العاطفية والأيدلوجية؛ إن البيانات ستساعدنا 
على فعل أشياء رائعة - مثل التنبؤ بالمستقبل". إن من شأن مثل هذه الادعاءات المتعلقة 
بالبيانات أن تعزز كثيرا من الدعايات بشأن البيانات الكبيرة داخل مجتمع الأعمالء ويتم 
التعبير عنها بشكل عام من خلال الصياغة التجريبية - التي مكن لها من خلال الحجم 
الكافي للبيانات أن تعبر البيانات عن نفسها. ومثل هذه الفلسفة التجريبية متضمنة بشكل 
أمثل (à‏ ادعاءات )2008( «Chris Anderson‏ وهو رئيس تحرير سابق فى مجلة وآيرد 
(Wired)‏ والذي ضربت دعوته التأليبية ob‏ البيانات الكبيرة ما هي إلا مؤشر على "انتهاء 
AUI‏ 45 على وتر حساس للكثير من ال معلقين. لقد ذكر Anderson‏ في مقطوعة استفزازية 
أن "طوفان البيانات يجعل المنهج العلمي مهملا"» وأن الأنمماط والعلاقات المتضمنة داخل 
البيانات الكبيرة تقدم بشكل متأصل معرفة مهمة وثاقبة عن العمليات الاجتماعية» 
والسباسية» والاقتصاديةء والظواهر المعقدة. وقد أكد ذلك قائلا: 
هناك الآن طريقة أفضل. فالبيتابايت تسمح ob UJ‏ نقول: "إن الارتباط كاف" 
.(Correlation is enough)‏ ومكننا أن نتوقف عن البحث عن النماذج. LS e‏ 
أيضا أن نحلل البيانات بدون أي افتراضات بشأن ما يمكن أن يظهره التحليل لنا. 
ويمكننا أن نرمي الأرقام في أكبر تجميعات الإحصاء التي شهدها العام يوماء وأن 
ندع الخوار زميات الإحصائية تجد الأنماط إذا كان العلم لا يستطيع إيجاد هذه 
الأماط... فالارتباط يحل محل السببية» ويمكن للعلم أن يتقدم ويتطور حتى 
بدون النماذج المترابطة أو النظريات الموحدة: أو آي تفسير آلى على الإطلاق. لذ 
لا يوجد أي سبب للتعلق بالطرق القديمة. 
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les‏ نحو مشابه» أكد )2009( Prensky‏ على أنه "لم يعد يتعين على العلماء الآن القيام 
بتخمينات تنم عن الثقافة: أو أن يقوموا بتأسيس افتراضات ونماذجء ويختبروا هذه الافتراضات 
وتلك النماذج من خلال التجارب والأمثلة المعتمدة ue‏ السانات. قدلا من ذلك يمكنهم 
التنقيب ف Loo Sa AR‏ عن الأنماط التي تظهر التأثيرات وتقده 
النتائج العلمية بدون إجراء أي تجريب إضاف". ومن ثم فلقد أكدت )2012( Dyche‏ أن: 
"التنقيب في البيانات الكبيرة يكشف العلاقات والأنتماط التي لم نكن نعرفها كي نبحث عنها'. 
واستمرت ف الادعاء قائلة: "هذه الأنماط محددة للغاية وتبدو وكأنه تم التحكم في تحديدها 
من خلال الافتراضات". وبالمثل: أكد )2013( Steadman‏ على ما «Ju‏ 


يتيح منهج البيانات الكبيرة تجاه gaz‏ المعلومات المبني على المعرفة للمحليين 
الحصول على القرار الكامل فيما يتعلق بالشئون dalle‏ النطاق. فلا يتم فقد أي 
شيء عند النظر عن قرب بالغ إلى جزء واحد محدد من البيانات؟ ولا يتم فقد ü‏ 
شيء عند محاولة الحصول على منظور واسع للغاية بشأن موقف حيث تم فقدان 
التفاصيل الدقيقة. فالخوارزميات تجد الأنماط فى حين أن الافتراضات تتبع من 
البيانات» ولا يجب على ال محلل أن يزعج نفسه حتى بطرح افتراض بعد الان. لقد 
تحول دورها من دور استباقي إلى دور تفاعلي» حيث إن الخوارزميات هي من 
تقوم بالعمل السياقي... فالخوارزميات ستقوم بتحديد الأماط ثم تقوم بوضع 
النظريات» ولذا فهناك حاجة متناقصة للقلق بشأن وضع افتراض في البداية ثم 
اختبار هذا الافتراض من خلال عينة من السانات. 
Sls‏ أخرق فدلا فو اعبار Ls I5]‏ كانت ass‏ الأقاط لتفترضة اة gl‏ (لعلافات 
توجد داخل مجموعة بيانات» فإن الخوارزميات مصممة للعمل على البيانات الكبيرة من 
أجل اكتشاف ارتباطات ذات دلالة بين البيانات دون أن يتم توجيهها من قبل الافتراضات. 
وكما قال )2012:56( :Croll‏ ق النموذج القديم المتسم بندرة البيانات» كان يتعين Ue‏ 
أن نقرر ما الذي ينبغي جمعه أولا ثم نقوم بجمعه. Ll‏ + النموذج الجديد المتسم بوفرة 
البيانات» فنحن نقوم بالجمع أولا Y‏ نسأل "là»y Als‏ 
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إن الأمثلة اللمستخدمة في توضيح مثل هذا الموقف عادة ما تكون نابعة من التسويق 
والتجزئة. فعلى سبيل «JULI‏ وصف )2012( Dyche‏ حالة سلسة تجزئة حيث قام بتحليل 
صفقات الشراء لمدة اثنى عشر lole‏ من أجل ملاحظة العلاقات المحتملة غير الملحوظة بين 
المنتجات التي انتهى بها الأمر في سلة المشتريات للمتسوقين. وقد أدى اكتشاف الارتباطات 
بين البنود ال معينة إلى تعيين الأماكن الملائمة للمنتج الجديد وإجراء بعض التعديلات على 
إدارة مساحة الأرفف مع زيادة تبلغ ZVT‏ في الإيرادات لكل حقيبة تسوق في الشهر التجريبي 
الأول. لم تكن هناك أي افتراضات بأن المنتج (س) على سبيل JEBI‏ غالبا ما يتم شراؤه مع 
المنتج (uo)‏ والتي تم اختبارها فيما بعد. لقد تم بكل بساطة طرح بعض التساؤلات بشأن 
البيانات من أجل اكتشاف ماهية العلاقات الموجودة التي لم يكن من الممكن ملاحظتها في 
السابق. وباممثلء فإن نظام التوصيات في موقع أمازون يقدم اقتراحات بشأن منتجات أخرى 
من الممكن أن يكون المتسوق.مهتماً بها دون معرفة أي شىء عن ثقافة als sl‏ الكتب 
والقراءة لذلك المتسوقء فهذا النظام يحدد. ببساظة: أنماط الشراء عبر العملاء وذلك من 
أجل تحديد ما إذا كان الشخص (س) يحب الكتاب (ص)» فمن ال محتمل أنه سوف يحب 
الكتاب (ز) وذلك بالنظر إلى الأنماط الاستهلاكية له وللآخرين. 


ويزعم Dyche‏ أن هذا امنهج امفتوح «3L LAS XJ‏ بدلا من ol‏ يكون lao S2‏ يعد 1 
احتمالية لكشف الأنماط الضمنية غير المعروفة: وذلك فيما يتعلق بسلوكيات ال مستهلك. 
والعلاقة بين المنتجاتء والمخاطر الماليةء والتى يمكن الاستفادة منها لاحقا. وف حين أن 
من الممكن أن يكون من ال مفضل توضيح أي ارتباطات موجودة داخل البيانات وما السبب 
في كون هذه الارتباطات ذات «JV»‏ فإن مثل هذا التفسير يعد غير ضروري بشكل (eS‏ 
فالمهم هو معرفة أنه يفعل ذلك. ومن ثم فلقد ادعى )90 :2013( Siegel‏ (هذا هو 
تأكيدي) فيما يتعلق بالتحليلات التنبئية: "نحن في العادة لا نعرف عن السببية» ونحن في 
الغالب لا نهتم بذلك بالضرورة... إن الهدف يركز بشكل كبير على التنبؤ أكثر من تركيزه 
على فهم العام... إنه بحاجة إلى أن ينجح فحسب؛ إن التنبؤ يفوق التفسير". وكما ادعى 
Weinberger (2011: 33)‏ فيما يتعلق بهنش (Hunch)‏ وهو موقع شبی agi‏ بتقديم 
توصيات بناء على الإجابات عن الأُسئلة التي يبدو أنها Y‏ ترتبط ارتباطا Us‏ بالأمئلة 
الأصلية التي تم توجيهها: 
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إن التحليل لا يدعم النظرية وهو لا يقدم آي نظرية. لا توجد لدى موقع 
(Hunch) |i:‏ أي فكرة م أن الناس الذين» على سبل «JUL‏ يفضلون ارتداء 
صندل على الشاطئ والذين لم يقوموا بنفح الهندباء (نبته بريه) في العام «sole‏ 
رما يحبون هذه الأفلام الأربعة (التي تم اقتراحها لهم). فالموقع لم يكن لديه أي 
افتراضء وم يكن لديه أي تخمين. كل ما كان لديه ارتباط إحصائي فحسب. 


إن بعض برامج تحليلات البيانات يتم بيعها من أجل هذا التصور بالضبطء فعلى 
سبيل JELI‏ فإن البعض يدعي أن برنامج التنقيب عن البيانات والعرض البصري آياسداي 
«(Ayasdi)‏ لديه القدرة على اكتشاف الرؤى بشكل الى بغض النظر عن التعقيد ودون 
توحصه أي Alt‏ ومكن لعملاء اياسداي أن يتعلموا m:‏ الإجابات عن الأسئلة التي م 
يكونوا يعرفون أن يسألوها في المقام الأول. ولعرض الأمر بصورة مبسطة: فإن آياسداي هو 
«سرنديبية رقمية» معنى أن Sla bl‏ لديه القدرة على اكتشاف الأشياء ال مفيدة مصادفة 
(من أسطورة أمراء سرنديب الثلاثة)(2013 (Clark‏ وعلاوة على ذلك» فهناك من يدعي أن 
آياسداي أزال بشكل JS‏ دور العنصر البشري في عملية التنقيب عن البيانات - ومن ثم 
فلقد آزال جميع التحيزات البشرية المتضمنة معه. ودلا من انتظار أن يتم توجيه سؤال 
al‏ أو أن يتم توجيهه إلى روابط بيانات موجودة dusa‏ فإن النظام سوف يقوم وبدون 
aos‏ باكتشاف DUY‏ التي رما لم يفكر المتحكم البشري أن يبحث عنها )2013 (Clark‏ 

إن هناك مجموعة قوية وجذابة من الأفكار التي تعمل في مثل هذه المجادلات والتي 
تجري على نحو متضاد مع المنهج الاستدلالي المسيطر ossis‏ داخل العلوم الحديثة. أولا: 
أنه هكن للبيانات الكبيرة أن تلتقط المجال بالكامل وأن تقدم قرارا كاملا. ثانيا: أنه لا توجد 
هناك حاجة للنظرية: أو النماذجء أو الافتراضات الاستنباطية. ثالثا: أنه من خلال تطبيق 
تحليلات البيانات بدون دراية مكن للبيانات أن تتحدث عن نفسها وهي متحررة من 
الصياغة والانحياز البشريينء وأن أي أنماط أو علاقات داخل البيانات الكبيرة تكون صادقة 
وهادفة بشكل أصلى. د أن انى متهاو السياق أذ المعرقة المرقطة با جال 


وهو الأسلوب الذي ا فيه i‏ العمل استقرائية dixo EUR‏ هذا p‏ 
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Gannon and Reid (2009)‏ أن 'التوافر الجاهز ق البيانات المتعددة يحول ال مناهج 
العلمية من الطريقة العلمية التقليدية التي تقودها الافتراضات إلى العلوم المعتمدة على 
الاستكشاف . وباطثل. يقترح )127 :2011( òl Weinberger‏ الهدف التقليدى للعلوم 
المتمثل في تكوين النظريات التي تدعمها الحقائق وتفسر الحقائق في الوقت ذاته يتحول 
في الوقت الراهن إلى "تقديم :نماذج معقدة تفسر العلاقات المعقدة" حيث "في بعض 
Qoa E‏ عن dani al‏ كتفت ون الى ووا E ae‏ م Mass‏ من adl‏ 
هناك ارتباط قوي ملاحظ بين المحاكاة والعالم الحقيقي والذي هنح الثقة ob‏ المحاكاة 
الأخرى سوف تقدم نتائج موتوقة . وقد ستخدم JELI Weinberger‏ المتعلق بوضع 
عمود على بعد متر واحد أمام asl‏ الأبواب ف برنامج محاكاة لتدفق خروج الناس à‏ حال 
الإخلاء والذي أدى إلى تدفق أفضلء ولكن دون وجود أي تفسير من النموذج للسبب الذي 
يجعل العمود يفعل ذلك. واقترح» بطرق أخرى متعددة» أننا لسنا بحاجة لأن نعرف السبب» 
وإنما نحتاج لأن نعرف أن العمود يفعل ذلك وأن تطبيق الفكرة سوف يساعد على إنقاذ 
حياة الناس» وقد göl‏ هذا ل )26 :2013( Andrejevic‏ حالة تسمى "ال معرفة بدون الفهم". 


مغالطات الفلسفة التجرسة :(The Fallacies of Empiricism)‏ 
لا يوجد هناك أي شك بأن البيانات الكبيرة لديهاء وسوف يكون لديها بشكل متزايد. 
تأثير على كيفية ممارسة وفهم العلوم. وعلى الرغم من ذلك فإن رؤية الفلسفة التجريبية 
بشأن كيفية تكون هذا العلم الجديد تعتمد على التفكير المغالط - جميع الأفكار الأربع 
التي تعزز تشكيلها مشكوك فيها. فلربما تكون هذه الأفكار جاذبة بشكل كبير» ولكن 
التدقيق النقدي والفلسفي يكشف مشاكل خطيرة مع كل فرضية. إن من المهم أن يتم 
التحقق من كل فكرة. كل بدروهاء قبل صياغه ;45$ بديله للعلم الذي تقوده البيانات 

والذي همزج بين سمات الإبعاد. والاستقراء والاستنتاج. 

أولا: يمكن للبيانات الكبيرة أن تلتقظ اللجال بالكامل وأن تقدم قرارا كاملا. حيث إن 
البيانات الكبيرة تكافح من أجل الشموليةء فمناصروها يدعون أنه من الممكن رؤية كل شيء 
داخل المجال (على سبيل JULI‏ جميع الأنشطة على موقع تويتر, أو جميع عمليات الشراء داخل 
سلاسل امتاجر الكبيرة)ء وأنه من الممكن أن نفهم بشكل كامل ما نراه )2013 Aeg (Vis‏ 
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الرغم من ذلكء وكما ناقشنا في الفصول ١‏ و۲ و١‏ فإن البيانات الكبيرة را تسعى إلى أن تكون 
شمولية؛ ولكنها تشكل كلا من التمثيل والعينة. فالواقعء أن جميع البيانات تقدم رؤى بصرية 
قليلة للعام» وليس رؤى شاملة: أي رؤى من وجهات نظر معينة باستخدام أدوات معينة. 
وذلك بدلا من رؤى بصرية شامله Y‏ تفط )2002 (Haraway 1991; Amin and Thrift‏ 
وعلاوة على «US‏ فإن المجالات تتطور وتتغيرء ومن ثم فإن البيانات الكبيرة ليس بإمكانها 
الوصول إلى كل مكانء وذلك يرجع من ناحية إلى أن البيانات الكبيرة لا يمكنها الإلمام بجميع 
الأماكن والأزمنة» ومن ناحية أخرى؛ فإن الكثير من الأماكن والأزمنة الجديدة تبقى لكي يتم 
اختراعها )128 :2002 (Amin and Thrift‏ وعلى هذا النحوء تشكل البيانات الكييرة 'سلسلة 
من الأوامر الجزئية والكليات المتمركزة, مع مقدرتها على التحديق في بعض الاتجاهات Ug‏ عن 
الآخر ى Latour)‏ وامقتبس في 92 :2002 (Amin and Thrift‏ ومن ثم فلقد استنتج Vis)‏ 
3 "آنه من المهم أن نتذكر أن ما نراه تتم صياغته من قبل ما نحن قادرون على رؤيته أو 
في الواقع ما نريد رؤيته من خلال إطار عمل فكري محدد . 

ثانيا: أنه لا توجد هناك حاجة للنظرية» أو النماذج: أو الافتراضات الاستنباطية. الافتراض 
هنا هو أن تكوين البيانات وتحليلات البيانات واللذان يعززان استخدام البيانات الكبيرة 
يبدو أنهما يأتيان من لا شيء» وأنهما بشكل ما متحرران من "القوة التنظيمية للفلسفة" 
.(Berry 2011: 8)‏ فالأنظمة المتناقضة تصمم من أجل التقاط أنواع duszo‏ من LLII‏ 
i‏ ما Lasu‏ ذلك من أجل أغراض محددة ole cols‏ التحليلات والخوارزميات اللتين 
تدعمان البيانات الكبيرة تعتمدان على الاستدلال العلمي وأنه تم صقلها من خلال الاختبار 
العلمي. فالعديد من الأفكار المستخدمة في تصميم نظم البيانات الكبيرة مستمدة من 
الأدبيات العلمية واسعة النطاق والتجارب وا معارف لهؤلاء الذين يعملون على النظام. 
إن هناك الكثير من الوقت ال مستنفد فى اختيار واختبار طرق متعددة لتحديد واستخلاص 
القيمة من السانات Asl‏ وتقييم النتائج وتطويع التحليلات. وهناك جدول أعمال 
يقود مثل هذا العمل وذلك فيما يتعلق ماهية النتائج المرجوة (زيادة دوران رأس JUI‏ أو 
الأرباح» أو فهم نظام معينء eJ]‏ والذي يستفيد من النظريات المبرهنة. وذلك فيما يتعلق 
ماهية الطرق الملحوظة لتحقيق مثل هذه التآثرات» وما إذا كانت مثل هذه التأثيرات 
تحدث ف الواقع ثم يتم اختبارها بعد ذلك. 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها vvv‏ 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الثامن 


وكما أشار )2012( Leonelli‏ فإن الإستراتيجية الاستقرائية لتحديد الأنماط داخل 
البيانات عادة ما يقودها الاستدلال العلميء وهي لا تحدث فراغا علميًا. أوء كما ذكر 
Quintero (2012)‏ "لا مكن تقديم التفسيرات ببساطة من التحليلات الإحصائية. وذلك 
دون الحاحة Jl‏ نظرية dilu‏ من نوع ما . وقد اتبع ذلك قائلا: "كونك منقادا بالسانات 
يعد أمرا مفيدا فحسب إذا كان لديك نظرية قوية يمكنك من خلالها أن تستمر في طريقك. 
ان أي شىء اخر سوف دتركك متجها A!‏ منحدر دون أن تراه". göl‏ أن كلا من الاستدلال 
الاستنتاجي والاستقرالي يتم تشكيلهما Lis‏ بشكل استطرادی ولا Liu‏ أحدهما من لا 
شيء. ومن ثم فقد اقترح )1979( Popper‏ مقس من )74 :2012( Callebaut‏ أن 
جميع العلوم تطبق منهج الأضواء الكاشفة على الاكتشاف العلميء حيث يكون تركيز 
الضوء Gallio‏ خلال النتائج السابقة والنظريات والتدريبء وكذلك من :خلال التخمين 
المؤسس على التجارب وال معارف. إن الأمر ذاته ينطبق على أمازون (Amazon)‏ وهنش 
(Hunch)‏ واياسداي ((Ayasdi)‏ وجوجل (Google)‏ فالكيفية التي اعتمد lyde‏ أمازن 
في بناء نظام التوصيات على الاستدلال المنطقي» كانت معززة من خلال نموذج إرشادي 
يرافقه اختبار تجريبي تم تصميمه من أجل تحسين أداء الخوارزميات التي يستخدمها. 
bbg‏ فإن جوجل يقوم ببحوث وتطوير واسع النطاق» وهو يعمل بالشراكة مع العلماء 
ويشتري ال معرفة العلمية» سواء تم هذا من خلال تمويل البحوث داخل الجامعات أو من 
خلال شراء ا معرفات الإلكترونية للشركات الأخرىء وذلك من أجل تنقية وتوسيع ال منفعة 
ouo‏ كيفية تنظيمه» وتقدهه» واستخلاصه للقيمة من البيانات. ونتيجة U‏ فإذا وجدت 
الخوارزميات الإحصائية أنماطا في البيانات» فإن ذلك يعود إلى أنه تم استخدام ele‏ التعرف 
على Lio ele‏ إلى جنب مع ال معرفة الخاصة بالمجال. 

ثالثا: مكن للسانات أن تتحدث عن نفسها وهی متحررة من الصياغة والانحياز البشريين. 
إن ال مفهوم القائل بأن إنتاج معرفة من البيانات الكبيرة يحدث بشكل غير مرتبط بالعلم: 
هو على علاقة بالفكرة القائلة ob‏ تحليلات البيانات الكبيرة تمكن البيانات من التحدث عن 
نفسهاء وهي غير مثقلة بالسياقية أو أهواء التوضيح البشري. فليس فقط إنتاج البيانات 
هو ما يتم بشكل افتراضي ومتحرر من النظرية» فحتى تفسير ومعاني تلك البيانات مكن 
بطريقة مشابهة أن يحدث في فراغ «rale‏ فمثل هذا المفهوم يعد سمة من سمات التفكير 
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التجريبي» وهو أنه عندما يتم تقديم وتحليل البيانات بطريقة AE‏ فإن البيانات» بنفسها 
ومن نفسهاء تشكل ذلا هلحا Joys‏ يظاهرة أو عملة Mas dione‏ مق dtd:‏ وق حالة 
البيانات الكبيرةء فإن حجم السانات يضيف إلى أهمية الدليل. فهذا "التقديس" للسبانات 
55 أن يؤديء كما ادعى )2013( Jenkins‏ إلى daz‏ السيانات OL ZSULI à‏ التى تتم 
من أجل البيانات الكبيرة. وهذا يعني أن البيانات تتفوق على النظرية» وأن البيانات أمر 
حقيقيء في حين أن النظرية ليست حقيقية )2013 (Hales‏ وأن البيانات تقول الحقيقة في 
حين أن النظرية مجرد تلفيق. وهناء يوجد ثلاث قضايا يتعين التفكير فيها: القضية الأولى 
هي افتراض أن البيانات موضوعيةء ومحايدةء ومتحررة من التحيز البشري. القضية الثانية 
أن الأماط والعلاقات داخل البيانات الكبيرة هادفة وصادقة بشكل متأصل. القضية الثالثة 
أن تفسير مثل تلك الأنماط والعلاقات يفتقر إلى آي نوع من الوضعية والموقعية. 

وكما ناقشنا فى الفصل الأول فإن البيانات ليست ببساطة polis‏ محايدة أو طبيعية 
بحيث يتم فصلها عن العام بطرق محايدة وموضوعية: ويمكن قبولها بالقيمة الاسمية. 
فالبيانات لا توجد قبل تكوينها ولا تنشأ من آي شيء. ولكن الأحرىء أن البيانات يتم إنشاؤها 
داخل مجاميع البيانات ال معقدة التي تشكل تركيبها بشكل Jles‏ ولا مكن للبيانات في هذه 
الحالة التحدث عن نفسهاء ولكنها على الدوام تتحدث. بشكل متأصل» من وضعية معينة 
.(Crawford 2013)‏ وعلاوة على US‏ فإن ادعاء )2008( ob Anderson‏ الارشاط يفوق 
السببية يشير إلى أن DYI‏ اللوجودة داخل مجموعة البيانات ذات معنى بشكل متأصل. 
وهذا افتراض يعرف جميع الإحصائيون ال مدربون أنه خطر وغير صحيح. فالارتباطات بين 
المتغيرات داخل مجموعة البيانات يمكن أن تكون عشوائية بطبيعتها ويوجد بينها ارتباط 
عرضي قليلء أو لا يوجد هذا الارتباط على الإطلاق (انظر الفصل التاسع). إن تفسير أي 
ارتباط على أنه ذو مغزى رها يؤدي في هذه الحالة إلى مغالطات dato‏ خطيرة. ويمكن أن 
يتفاقم هذا الأمر في حالة البيانات الكبيرة. وذلك يرجع إلى كون الموقف التجريبي يظهر 
وكأنه يعزز ممارسة تجريف البيانات - البحث عن أي ارتباط - ومن ثم يزيد من احتمالية 
اكتشاف ارتباطات عشوائية. وعلى الرغم من ذلك» ففي حن أن التعرف على الأماط 
رما يحدد علاقات شيقة محتملة: إلا أن صحة هذا الأمر تستلزم اختباره على مجموعات 
بيانات أخرى وذلك من أجل التأكد من مصداقيتها وصحتها. وبعبارة أخرىء يتعين أن 
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تشكل العلاقات أساس الافتراضات التي يتم اختبارها على نطاق أوسع: والتي تستخدم بعد 
ذلك من أجل «Lo‏ وصقل النظرية التي تفسرهاء ومن ثم فإن الارتباطات لا تفوق السببية: 
ولكنها بالأحرى يجب أن تشكل أساس بحوث إضافية من أجل معرفة ما إذا كانت مثل 
هذه الارتباطات دالة على السببية» وق هذه الحالة فقط يمكننا أن ندرك مدى مغزى أسباب 
الارتباط. 

وفي حين أن الفكرة القائلة ob‏ البيانات تتحدث عن نفسها وهي متحررة من التحيزات 
أو أن الصياغة رها تبدو وكأنها فكرة جاذبة: إلا أن الواقع مختلف إلى حد ما. فبحسب ما 
أشار )166 :1981( «Gould‏ فإن "البيانات غير الحية لا مكنها أبدا أن تتحدث عن نفسهاء 
ونحن دوما نحاول أن نوجه بعض إطار العمل المفاهيمي: سواءٌ كان بديهيا ومشكلا بصورة 
سيئة» أم US a‏ بشكل محكم ومنهجي» نحو مهمة الاستقصاء والتحليل؛ والتفسير". إن 
فهم البيانات دوما مؤطر؛ ويتم فحصها من خلال منظور معين يصوغ كيف تتم ترجمتها. 
وحتى لو كانت العملية مؤتمتة بطريقة do‏ فإن الخوارزميات المستخدمة لمعالجة السيانات 
عادة ما تكون متشبعة بقيم duse‏ وتكون مقترنة بالسياق داخل منهج علمي معين. 
وكما أوضح )2013( olè :Hales‏ "أي اختبار Las]‏ أو خوارزمية تعلم آل تعبر عن 
منظ وز ماهية النمط آورالنظام aol‏ الخواززميات وف X ed‏ نمطا ماء ف جين تجد 
خوارزمية أخرى شيئا آخر". فإذا ترجم ذاك شخص ماء فسيكون من المحتم أن يستفيد 
من معرفته» ومهاراته» وحذسه المتراكم من أجل تنقية رؤاه. حتى يقوم محلل مختلف 
بطرح نتائج مختلفة من نفس التحليلات. فالفهم أو التفسير يتشكل ف العادة من خلال 
أعين ا لمشاهدين بغض النظر عن ادعائهم أنهم محايدون أو متحررون من القيمة الناتجة. 
وعلاوة على ذلك» فإن التفسيرات ليست ثابتةء فهي تتغير كلما تعرضت إلى معارف جديدة 
من خلال «soo‏ أو مناقشات: أو مجادلات إضافية. وعلى dis‏ فإن السانات لا تتحدث 
عن نفسها da‏ وكما ادعى )9 :2012( Silver‏ "نحن نتحدث LJL‏ عن السانات". 

رابعا: المعنى يتجاوز السياق أو المعرفة المرتبطة با مجال. إن من الجوانب المرتبطة 
بالفكرة القائلة ob‏ البيانات تتحدث عن نفسه المفهوم القائل ob‏ تفسير البيانات الكبيرة 
لا يتطلب معرفة سياقية أو مرتبطة مجال معين. وبدلا من ذلكء فالمهم هو المقدرة على 
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توضيح (isl‏ داخل البيانات» فبسبب أن البيانات من المفترض أن تتحدث عن نفسهاء 
مكن لأى شخص ذو فهم معقول بالإحصاء أن يكون قادراً على تفسيرها. إن هناك شكوكا 
قليلة فيما يتعلق بأن علماء البيانات والحاسب والعلماء الآخرين يتحركون داخل نطاق 
تخصصات بعضهم البعض مع انتشار البنى التحتية للبيانات والحوسبة. وف الكثير من 
الحالات» فإنهم لا يقدمون آدوات جديدة فحسب» ولكنهم يشتركون dlei‏ في تفسير 
البيانات. ومع ذلكء فإن هؤلاء العلماء لديهم القليل من الفهم المعمق ف المجال المناط بهم 
وكذلك بالنظريات التجريبية المتعمقة وا معارف التي تم تأسيسها عبر فترات زمنية طويلة. 
فعلى سبيل JELI‏ فيما يتعلق بالعلوم الاجتماعية والإنسانية» فإن الأساليب الجديدة من 
التحليلات والبنى التحتية للبيانات توجه من قبل علماء الحاسب والفيزياء. وفي الغالب 
تجعل النتائج أولئك المتشربين لوجهة النظر التخصصية يستسلمون وينقادون لهذه النتائج. 

ولتوضيح هذا الجانب» فإن المجال الناشئ للفيزياء الاجتماعية. والذي من خلاله يقوم 
الفيزيائيون وآخرون باتخاذ قرارات olio‏ العمليات الاجتماعبة وال مكانية ilo‏ على تحليلات 
البياننات الكبيرة. وخاصة تلك المتعلقة بالمدن والقوانين المفترضة التي تعزز صياغتها 
ووظائفها )2013 «(Bettencourt et al. 2007;Lehrer 2010; Lohr‏ غالبا مايتجاهل 
عن عمد ثقافة ele‏ الاجتماع الممتد لقرنين من الزمان» ويشمل ذلك تجاهل التحليلات 
الكمية والنماذج اطبنية u‏ يقارب قرنا من الزمان. والنتيجة هي تحليل ال مدن الذي يكون 
اخقزاليا إل خد siis «uS‏ و يتجاهل تأثيرات الققافة. والسياسنة: والحوكمة #راس «JU‏ 
وتقاليد ثرية من العمل الذي سعى نحو فهم كيفية عمل امدن من النواحي الاجتماعية؛ 
والثقافية» والسياسية: والاقتصادية والنتيجة إعادة إنتاج الأنواع ذاتها من أوجه القصور التي 
أوجدتها العلوم الاجتماعية الكمية / الوضعية في منتصف القرن العشرين );2914 Kitchin‏ 
.(Mattern 2013‏ وهذا Lal‏ يتعدى حدود التقاليد المتنوعة والثرية XJ‏ الفلسفي 
ويعمل على تعزيز المناهج الفلسفية التجريبية والوضعية بصفتها أفضل وسيلة لفهم ال مدن 
مع أنه من ال محتمل ألا يتفق مع هذه JI‏ 453 النظرية إلا القليل lao‏ من العلوم الاجتماعية 
التي تلت pas‏ الفلسفة الوضعية )2013 (Kitchin‏ 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها ۳۷ 


7 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 





الفصل الثامن 


إن هناك مجموعة متشابهة من ال مخاوف لدى أولئك العاملين في مجال العلوم. 
فقد أشار )2012( Strasser‏ على سبيل JUI‏ إلى أنه في العلوم البيولوجية: ادعى 
متخصصو المعلوماتية الحيوية الذين لديهم أسلوب معين وضيق للغاية لفهم علم 
الأحياء» أن الأرض كان يسكنها في السابق الأطباء السريريون وعلماء الأحياء التجريبيون 
والجزيئيون. وأشار إلى أن: "تحويل التحليل إلى البيانات الرقمية... يفسح المجال أمام 
الأسئلة المعرفية كتلك المتعلقة من هلك الشرعية ليكون منتجا للمعرفة- المهتم بالآثار 
gl)‏ الطبيب السريري أو ble‏ البيولوجيا الجزيئية) أو الإحصان الذي يحلل البيانات 
ويقدم المحاكاة أو النموذج )2012: 7). ومن ثم فإن بعض علماء البيانات بدون شك 
بتجاهلون ملاحظات )2013( «Porway‏ وهى: 


بدون توافر خبراء في موضوع البحث من أجل توضيح المششاكل مسبقاء فسوف 

نحصل على نتائج ضعيفة... وبدون شك فإن هناك حاجة إلى خبراء في موضوع 

البحث من أجل تقييم نتائج العمل وخاصة عندما يتعامل الفرد مع بيانات حساسة 

عن السلوك البشري. وبوصفنا علماء بيانات» فنحن مؤهلون بشكل جيد للتعامل 

مع "ISL"‏ فيما يتعلق بالبيانات» ولكن لا يجب Ue‏ إلا فيما ندر التعامل مع سؤال 

"ISU"‏ فيما يتعلق با موضوعات التي لا نكون خبراء فيها. 

Ss‏ أشنار .Porway‏ فإن المطلوب بالفعل هو أن يعمل علماء السانات وخراء 
النطاق مع بعضهم البعض من أجل التأكد من أن تحليلات البيانات االمستخدمة مفهومة 
وآن النتائج من مثل هذه التحليلات يتم تفسيرها بعقلانية وسياقية. وباط مثلء يدعو 
Lazer et al. (2009: 10 - 11)‏ إلى التعاون بين elle‏ الاجتماع الضالعين إحصائيا وبين 
elle‏ الهاسست css LaJl‏ عاونا )10:2009 — 11( وفيا ا ى 
Minelli et al. (2013)‏ أن فرق علماء البيانات ينبغي أن يعملوا مع خبراء Dlhe‏ 
الأعمال من أجل الاستفادة من الرؤى المناسبة (انظر أيضًا الجدول .)١-١‏ 


العلم المقاد بالسانات :(Data-driven Science)‏ 
يسعى العلم المقاد بالبيانات» بدلا من كونه متجذراً ف الفلسفة التجريبيةء إلى التمسك 
معتقدات الطريقة العلمية» ولكنه أكثر انفتاحا لاستخدام مزيج مختلط من المناهج 
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الاستدلاليةء والاستقرائية» والاستنتاجية» من أجل تطوير فهم الظاهرة. liag‏ يختلف عن 
التصميم الاستدلالي التجريبي التقليدي في أنه يسعى إلى طرح افتراضات ورؤى يتم توليدها 
من السانات بدلا من تولبدها من النظريات )613 :2009 .(Kelling et al.‏ ويعبارة 
أخرى» فهو يسعى إلى دمج أسلوب من الاستقراء في تصميم البحوثء» وذلك على الرغم 

هن أن الشرح من خلال الاستقراء ليس هو الغاية المستهدفه LS)‏ هي الحال مع امناهج 
التجرسة). ودلا من ذلك. فهو TRY bad Jio‏ من أسالبيب توليد الفرضيات قبل 
استخدام ال منهج الاستنتاجي. ولا تنشأ عمليه الاستقراء من لا شىء»ء ولكنها تقع وتقترن 
بسياق نطاق نظري متطور للغاية. ومن ثمء فإن الإستراتيجية ال معرفية المتبناة داخل العلم 
المقاد بالبيانات هي استخدام أساليب موجهة لاكتشاف المعرفة من أجل تحديد الأسئلة 
(الافتراضات) ال محتملة الجديرة باختارات وبحوث إضافة. 


فالعملية يتم توجيهها من ناحية أن النظرية الحالية تستخدم من أجل توجيه ilas‏ 
اكتشاف المعرفة: وذلك بدلا من أن نأمل ببساطة أن نحدد جميع العلاقات داخل مجموعة 
البيانات وأن نفترض أنها ذات معنى بطريقة أو بأخرى. ومن ثم فإن كيفية تكوين 
البيانات أو إعادة تحديد الغرض منها تقوده افتراضات معينة تعززها خيرات ومعارف 
عملية «o ss‏ مثل ما إذا كانت التقنيات وإعدادها سوف تلتقط أو تنتج مواد بحثية 
مفيدة وملائمة. فبذلاً من إنتاج البيانات بأي dl. us‏ ممكنة: وذلك باستخداة أي نوع من 
التقنيات المتاحة أو أي نوع من أطر التمثيلء يتم التفكير بعناية في إستراتيجيات تكوين 
البيانات وإعادة توظيفهاء مع اتخاذ قرارات إستراتيجية من شأنها أن تؤدي إلى أنواع معينة 
من البيانات. وعلى نحو مشابه» يتم توجيه كيفيه معالجه وإدارة وتحليل هذه البيانات 
من خلال الافتراضات المتعلقة ماهية الأساليب التي رها توفر رؤى هادفة. فالبيانات لا 
مكن إخضاعها لأى صباغة وجودية ممكنة. ولا مكن إخضاعها كذلك sY‏ نوع من أساليب 
الثثقيب عن السانات: e‏ آمل أنها رجا تك ف يعض الحقائق Mag. ARAU‏ من ذلك: 
يتم اتخاذ القرارات ا مبنية على النظرية olis‏ الطريقة الأمثل للتعامل مع مجموعة البيانات 
T‏ يمكنها أن تكشف امعلومات التي رما تحمل فائدة محتملة وتكون جديرة Dgan‏ 
إضافية. وددلا من اختبار صحة أي علاقة يتم كشفهاء فإن الاهتمام يتركز على تلك العلاقات 
-بناء على بعض المعايير - التي يبدو أنها تؤدي إلى المسار الصحيح أو من ال محتمل بشكل 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها وناب 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الثامن 


أكبر أن تؤدي إلى المسار الصحيح. وف الواقع» فإن الكثير من العلاقات ال مفترضة داخل 
مجموعات البيانات يمكن تنحيتها على أنها تافهة أو سخيفة من قبل متخصصي المجالء في 
حين يتم وسم البعض الآخر على uil‏ تستحق اهتماما إضافيا )2010 (H.J. Miller‏ 

إن مثل عملية اتخاذ القرار هذه فيما يتعلق بطرق توليد البيانات والتحليل تعتمد على 
التفكير الاستدلالي. والاستدلال هو وسيلة للاستنتاج والتفكير المنطقي تم وضعه بواسطة 
(C.S. Peirce (1839 - 1914) (H.J. Miller 2010‏ ويهدف الاستدلال إلى خاتمة تكون 
ذات معنى منطقي ومعقولء ولكنها ليست حاسمة ف ادعاءاتها. فعلى سبيل JE‏ لا 
توجد أي محاولة لاستنتاج ما هي أفضل طريقة لتوليد البيانات» ولكن يمكن بدلا من ذلك 
تحديد طريقة ذات معنى منطقي بالنظر إلى ما هو معروف بالفعل عن إنتاج مثل هذه 
البيانات. ويستخدم الاستدلال بشكل شائع في العلوم وخاصة. في تشكيل الافتراضات» على 
الرغم من أن مثل هذا الاستخدام غير معترف به على نطاق واسع. ولذاء فإن أي علاقات 
يتم كشفها داخل البيانات لا تنشأ من لا شيء: ولا تتحدث عن نفسها ببساطة كذلك. إن 
عملية الاستقراء - للرؤى الناشئة من البيانات - تتم صياغتها بشكل سياقي. وهذه الرؤى 
ليست coUa doli‏ الاستقصاء. ]5 يكم 5 ا وتف برها من خلال نظرية G‏ وندلا من 
ذلك» فإن الرؤى توفر الأساس لتشكيل الافتراضات والاختبار الاستنتاجي لصحتها. وبعبارة 
5,21« يعد العلم اممقاد بالبيانات نسخة معاد تشكيلها من الطريقة العلمية التقليديةء مما 
يوفر وسيلة جديدة لبناء نظرية»ء وإضافة إلى ذلكء فإن التغيير المعرفي هو هادف بحد ذاته. 


ويدعي البعض أن العلم المقاد بالبيانات سوف يصبح النموذج الجديد للطريقة العلمية 
في عصر البيانات الكبيرة والمتدرجة لأن التفضيل المعرفي يتناسب مع استخلاص رؤى إضافية 
وقيمة سيفشل العلم التقليدى المقاد با معرفة في توليدها Kelling et al. 2009; H.J)‏ 
.(Miller 2012: Loikides 2010‏ إن العلم امقاد b‏ معرفة. عند استخدامه طنهج استنتاجي 
مباشرء له فائدة معينة في فهم وتفسير العام تحت ظروف البيانات النادرة والحوسبة 
الضعيفة: ولكن الاستمرار في استخدام مثل هذا النهج لا يبدو آنه مفهوم بشكل AS‏ 
عندما تشر التطورات التقنية وا منهجية إلى أنه من ال ممكن الاضطلاع بتحليلات أكثر ثراء 
للبيانات - تطبيق تحليلات جديدة للبيانات وتوفر القدرة على ربط بيانات كبيرة ومتفاوتة 
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lacu‏ بطرق كانت غير ممكنة لوقت قريبء والتى تقدم بيانات جديدة قيمة - والتحديد 
والتعامل مع الأسئلة بطرق جديدة ومؤترة. فالعلم امقاد بالبيانات. بحسب ما يتم نقاشهء 
يتناسب أكثر مع استكشاف واستخلاص القيمة وفهم مجموعات البيانات الهائلة والمترابطة, 
وتعزيز البحوث متعددة الاختصاصات التي تدمج خبرات المجال من خلال الإطار النظري 
الاستهلالي كونها أقل محدودية» وسوف تؤدي إلى نماذج ونظريات أكثر شمولية وعمومية 
للآنظمة المعقدة بالكامل yas‏ من pole‏ منها )2009 (Kelling et al.‏ 

فعلى سبيل المثالء يدعي البعض أن العلم المقاد بالبيانات سوف يحول فهمنا عن 
الأنظمة البيئية )2009 .(Bryantetal. 2008; Lehning et al.‏ وسوف يتيح إمكانية 
التكامل بين بيانات آنية ولحظية وعالية الدقة وذلك في سبيل تقديم نماذج تفصيلية للبيئة 
المتغيرة على النحو الذي يتعارض مع نقاط ثابتة غير متغيرة عبر المكان والزمان. ويقصد 
هنا التكامل بين البيانات التي يتم توليدها من العديد من المصادر كمحطات الطقس 
التقليدية والمتحركة: والأقمار الصناعية والتصوير الجويء ورادارات الطقس» ومحطات رصد 
التيارء ومحطات القياس» وملاحظات المواطنين» والاستشعار الجوي واختبار جودة المياه 
ومقاييس الغاز» وفحص التربةء والحساسات الموزعة التي تقيس الظواهر المختارة مثل 
درجة الحرارة والرطوبة. ومن شأن ذلك التكامل أن يسهم فى تحديد العلاقات الخاصة 
بين الظواهر والعمليات التي تولد افتراضات ونظريات جديدة يمكن اختبارها بعد ذلك 
من أجل التحقق من صحتها. وهذا سوف يساعد أيضا على تحديد وفهم BUS‏ الربط 
بين مجالات بيئية مختلفة مثل الغلاف الجوي (الجو)ء والغلاف الحيوي (الأنظمة البيئية)» 
والغلاف GUI‏ (أنظمة المياه). والقشرة الأرضية (القشرة الصخرية للأرض)ء والغلاف الترابي 
(التربة)» والمساعدة على دمج النظريات في مجاميع نظرية أكثر شمولية. ومن شأن هذا 
أن يوفر فهما أفضل للعمليات المترابطة والمتنوعة في أرض الواقع والعلاقات الترابطية بينها 
وبين الأنظمة البشرية» ويمكن استخدامه كذلك من أجل توجيه النماذج وا محاكاة من أجل 
التنبؤ بالاتجاهات طويله المدى والإستراتيجيات التكيفية الممكنة. 
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العلوم الاجتماعية الحاسوبية والعلوم الإنسانية الرقمية 
(Computational Social Sciences and Digital Humanities)‏ : 

في حين أن معرفية العلم 3L RU‏ بالبيانات تبدو كما لو كانت وضعت لتحويل منهج 
البحث المطبق في العلوم الماديةء والطبيعيةء والحياتية» والهندسية» إلا أن مسارها في العلوم 
الاجتماعية والإنسانية يبدو أقل تأكيدا. فهذه المجالات من العلوم متنوعه بشكل كبير في 
أسسها الفلسفيةء وخاصة مع قيام عدد قليل فقط من العلماء في هذه المجالات بتوظيف 
امعرفة ال مشتركه بين العلوم. فهؤلاء الذين يستخدمون الطريقة العلمية من أجل تفسير 
ونمذجة الظواهر الاجتماعيةء بشكل vele‏ يستفيدون من أفكار الفلسفة الوضعية (على 
الرغم من انهم رها لا يستخدمون Jis‏ هذا العنوان. 2006 (Kitchen‏ ومثل هذا العمل 
ميل إلى التركيز على المعلومات الواقعية والكمية - الظواهر المشاهدة تجريبيا والتي يمكن 
قياسها بشكل فعال كالأعداد والمسافات والتكلفة والوقت على النحو الذي يتعارض مع 
المجالات الأكثر مادية من الحياة الإنسانية مثل المعتقدات والأيدولوجيات - باستخدام 
الاختبار Las VI‏ من أجل تأسيس علاقات سببية وبناء النظريات والنماذج التنبئية 
وا محاكات. فالمناهج الوضعية مؤسسة بشكل جيد في الاقتصاديات» والعلوم السياسية. 
والجغرافيا البشرية» وعلم الاجتماع: ولكنها نادرة بشكل كبر في العلوم الإنسانية. وعلى 
الرغم من ذلكء فداخل هذه التخصصات المذكورة» كانت هناك حركة قوية خلال النصف 
الأخير من القرن اماضي تجاه المناهج ما بعد الوضعية؛ وخاصة في الجغرافيا البشرية وعلم 
الاجتماع. 

وفيما يتعلق بعلماء الوضعية ف العلوم ue VI‏ فإن السنى التحتية OLLU‏ والبيانات 
امفتوحة والسيانات الكييرة توفر فرصا هائلة من أجل تطوير تماذج Asi‏ تطورا وأكثر دقة Aes å‏ 
نطاق واسع للحياة الإنسانية. فثورة البيانات توفر إمكانية الانتقال من دراسات ال مجتمعات 
التي تتسم بالندرة في البيانات إلى الدراسات الثرية في البيانات» ومن اللقطات الثابتة إلى 
الانتشار ٠ oon‏ ومن | التجميعات الرديئة إلى الدقة العاليةء ومن النماذج البسيطة نسبيا 
إلى محاكاة أكثر 5 سنا .)Kitchen 2013) halia‏ !5 هناك احتمالية لعصر جديد من 
العلوم الاجتماعية ioa‏ التي تجري دراسات ذات اتساع» وعمق» ومدى. وإطار زمني 
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أكبر بكثير» وهي تغطي فترات زمنية متعددة بشكل متأصلء وذلك على النقيض من بحوث 
العلوم الاجتماعية الحالية )2012 (Lazer et al. 2009; Batty et al.‏ وعلاوة على US‏ 
فإن حجم» وصحة» وتنوع» وشمولية» ودقة» وارتباطية» ومرونة» وتوسعية البيانات» بالإضافة 
إلى القوة المتزايدة للحوسبة وتحليلات البيانات dyad‏ تتعامل مع بعض انتقادات علماء 
الوضعية حتى اليوم» وخاضة تلك المتعلقة بالاختزالية والشموليةء وذلك من خلال تقديم 
تحليلات أكثر دقة وحساسية ls‏ يمكنها أن تهتم بالسياق والاحتمالية: ويمكن استخدامها 
من أجل صقل وتوسيع الفهم النظري للعام الاجتماعي المكاني. وعلاوة على ذلك» وبالنظر 
إلى شمولية البيانات» فمن الممكن اختبار صحة مثل هذه النظرية عبر العديد من المواقف 
والبيتات. وف مثل هذه الظروف. فإن المعرفة عن الأفراد. والمجتمعات. والجماعات: 
oU Is‏ سوف تصبح أكثر taiii Lad‏ وذلك فيما يتعلق بصياغة السياسه والتعامل مع 
القضايا المتعدذة التي تواجه البشرية. إن التحدي الكامن في مثل هذا السيناريو لم يعد هو 
البيانات» ولكن تأسيس طرق إحصائية ونمذجة جديدة لها المقدرة على التعامل مع ملايين 
أو oo‏ لمشاهدات )2012 (Batty et al.‏ 

وبالنسبة لعلماء ما بعد الوضعية» فإن 3 5s‏ البيانات المنتشرة توفر كلا من الفرص 
والتحديات. فالفرص تتمثل في رقمنة وربط البيانات التناظرية وغير المنظمة» والتي يُعد 
الكثير منها جديداً كوسائل التواضل الاجتماعي» والكثير منها كان من الصعب الوصول 
إليها في السابق كملايين الكتب» وا مستندات. والصحفء. والصورء والأعمال الفنيةء والأشياء 
المادية... إلخ من عبر التاريخ والتى تم تحويلها إلى الصيغة الرقمية خلال العقدين السابقين 
من خلال مجموعة من المنظمات) )2008 (Cohen‏ وإتاحة ادوات جديدة معالحة وادارة 
وتحليل البيانات؛ وتوفر وسائل جديدة لتعزيز التعاون بين مختلف التخصصات وتجاوز 
نموذج العام الواحد؛ وتوسعة الروابط البحثية مع المؤسسات غير الأكاديمية وتضمين جمهور 
جديد على نطاق أوسع )2008 .(Sword‏ وتخضع هذه الفرص للدراسة على نطاق واسع 
من خلال المجال الناشئ للإنسانيات الرقميةء والذي يجمع TRIBUERE‏ من جميع العلوم 
الإنسانية كال مؤرخينء واللغويينء والفنانين ال مبدعين» وعلماء الأدب والإعلام... إلخ مع أخصاق 
الممكتبات» وعلماء الحاسبء والسانات: وال معلومات. 
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وبشكل مبدثيء فإن العلوم الإنسانية الرقمية تتشكل من معالجة وتحليل البيانات 
التي تكونت في الأصل بشكل رقميء ورقمنة وأرشفة المشروعات التي تسعى إلى تحويل 
النصوص Sls Ll‏ التناظرية إلى صيغ رقمية بحيث ممكن تنظيمها والبحث فيها وإخضاعها 
لأشكال أساسية من التحليلات AII‏ والموجهة: والشاملة. مثل العروض اطرئية ا موجزة 
للمحتوى أو الروابط بين ال مستنداتء والناس أو الأماكن )2009 (Schnapp and Presner‏ 
ونتيجة لذلكء فلقد ادعى المؤيدون أن المجال قد تطور لي يوفر أدوات أكثر تطورا 
معالجة. وبحث. وربطء ومشاركة. وتحليل البيانات التي تسعى إلى إتمام ودعم طرق 
العلوم الإنسانية الحالية وتسهيل الأشكال التقليدية من التفسير وبناء النظرية» وذلك بدلا 
من استبدال الطرق التقليدية أو تقديم منهج وضعي أو تجريبي لعلماء العلوم الإنسانية 
(Berry 2011; Manovich 2011)‏ 

إن ما توفره العلوم 45L 5I‏ الرقمية هو وسيلة لمعالجة ومشاركة البيانات» 63b 5s‏ 
التحليل التقليدي» وتعزيز البحوث عبر مدى وحجم أكبر بكثير من المصادرء وتوفير الوقت 
والجهد. وبدلا من التركيز على حفنة من روايات العصر الفيكتوري أو صور من أوائل القرن 
العشرين أو اثنين من فناني عصر النهضة وأعمالهم: يصبح من ال ممكن البحث والربط عبر 
عدد كبير للغاية من الأعمال ذات الصلةء وبدلا من التركيز على حفنة من ال مواقع الشبكية 
أو غرف الدردشة أو الصور أو الفيديوهات أو الصحف الإلكترونية» يصبح من ال ممكن دراسة 
الآلاف من Jis‏ هذه الوسائط. ومن ثم فلقد ادعى )2011( Manovich‏ أن: "الدراسة 
المعززة بالحاسب cole sane‏ بيانات ثقافية هائلة bale‏ ما تكشف أنماطا جديدة للبيانات 
التي لا هكن حتى من خلال القراءة المتأنية لأفضل دليل أن تكشفها". وبالطبع» فإن جيشا 
من slale‏ العلوم الإنسانية لن يكون قادرا بشكل حريص على القراءة المتأنية لمجموعات 
بيانات هائلة في المقام الأول. وادعى )2005( Moretti‏ أن العلوم الإنسانية الرقمية ستطبق 
الصرامة المنهجية على التخصصات التي كانت في السابق غير نظاميه وعشوائية في تركيزها 
ومنهجها المتبع. وادعى أن الأدبيات ذات الصلة بالأعداد. والأشكالء والوسائط ال مرئية من 
ا لمحتمل أن توفر رؤى جديدة وتضفي s;‏ جديدا على المجالات AS al‏ 
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وف الوقت ذاته. وكما أن هناك Ló‏ هناك أيضا مجموعة من التحديات. فبالنسبة 
للمعارضين: فإن استخدام طرق العلوم الإنسانية الرقمية الجديدة سوف تعزز ما أطلق 
عليه )2005( Moretti‏ مصطلح "القراءة عن بعد" حيث مكن لأجهزة الحاسب أن تعمل 
مثل الات القراءة )2010 (Ramsay‏ فمثل هذا النهج يتعارض مع الممارسة الراسخة منذ 
أمد بعيد والمتعلقة بتوفير قراءة متأنية للمصدر. وقد ادعى )20 :2010( Culler‏ على 
سبيل المثال بأن: "ما يتعارض مع القراءة المتأنية ليس القراءة عن بُعد ولكن شيئا ما Jia‏ 
القراءة غير المتقنة أو القراءة العرضية". واستمر قائلا بأن القراءة المتأنية تتضمن الاهتمام 
بكيفية إنتاج أو نقل المعنىء وبنوع الإستراتيجيات والأساليب الأدبية والبلاغية المستخدمة 
من أجل تحقيق ما يمكن للقارئ أن يأخذ به على أنه المؤثر على العمل أو الفقرة (ص 
22( وهذا شيء لا يمكن للقراءة عن بعد أن تقوم به» فقلق Culler‏ ناتج عن أن العلوم 
الإنسانية الرقمية لا تسهل أو تعزز "القراءة عن بعد" فحسب» بل lil‏ تجعل "من الممكن 
إجراء البحوث الأدبية بدون القراءة على الإطلاق: مثل إيجاد كافة الحالات التي وردت فيها 
كلمتي "يتسول" و"متسول" في روايات كتبها اثنان من المؤلفين ثم كتابة النتائج" (ص 24). 

وعلى نحو مشابه. ذكرت )164 :2009( Trumpener‏ بآن: "النموذج المقاد ا 
لتاريخ الأدب... يبدو أنه يتطلب يدا مجهولة غير مرئية. وعلاوة على US‏ فإنه يحدد 
الأماط ولكنه يتجنب تحديد السببية»ء والتي لا مكن تحديدها من خلال تتبع محفوظات 
الناشرين» وقراءة مسودات المخطوطات الفردية في مكتبات الكتب النادرة ومحاولة فهمء 
من كتاب لكتاب» من قام بتحديد عنوان كل رواية: المؤلفء الناشرء أو وكيل الدعاية" oe)‏ 
24 وبالنسبهة لهاء فإن مثل هذا البحث يتضمن حركة حقيقيه وليس استخدام مجموعة 
من الخوارزميات. كما أكدت أن تحليل آلاف النصوص يعني "أن أي نص معين سوف يصبح 
غير ذي صلة من الناحية الإحصائية" (ص 164). واستمرت قائلة " أي محاولة لرؤية الصورة 
بالكامل تحتاج إلى دعم من قبل المعرفة الواسعة وفهم تأريخي فطن بكيفية عمل الأساليب 
وامؤسسات الأدبية والأدوات التفسيرية القاطعة. وف معرض تقديرها للجزافية ". اختتمت 
كلامها (ص (Yvi - ١7١‏ قائلة إنه من eal"‏ أن معظمنا تخلى عن الاستمرار في البقاء في 
المكتبة... فاليأس من عدم توافر المعرفة الشاملة يجب ألا يدفعنا إلى التفكير المتطرف 
المعاكس بأنه يجب علينا أن lus‏ في معالجة الأدبيات بكميات هائلة لي نحرز أي تقدم". 
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وبا مثل: فبالنسبة ل )2012( Marche‏ فإن الآثار الثقافية مثل الأدبيات لا مكن معاملتها 
كونها مجرد بيانات. فالجزئية الأدبية المكتوبة لا مكن أن تكون ببساطة مجرد ترتيب 
للحروف والكلمات» بل هي مقترنة بالسياق وتنقل المعنى ولها سمات تفوق الوصف. 
فالخوارزميات ضعيفة للغاية فيما يتعلق بالتقاط وفك تشفير المعنى أو السياقء وكما 
ادعی Marche‏ فإن الخوازميات تعامل جميع الأدبيات كما لو كانت هي نفسها. واستمر 
قائلا: "إن التحليل الخوارزمي للروايات والمقالات في الجرائد يكون بالضرورة ضمن حدود 
الاختزالية. إن عملية تحويل الأدب إلى بيانات تزيل التفوق 15« وهي تزيل التذوق وتزيل 
جميع الدقة من Al‏ وتزيل التاريخ المرتبط بإطلاق هذا «asl‏ فرواية "إلى المنارة" ما 
هي إلى رواية أخرى من ضمن ركام الروايات". 

وعلاوة على ذلك فبالنسبة للآخرين: فبدلا من العمل على المضادر الأصلية» فإن العلوم 
الإنسانية الرقمية تتعامل مع الأشياء الرقميةء التى تنقل ذفعة واحدة وتختلف من الناحية 
الكيفية عن أصولها (بمعنى أنها وصف للوصف) وذلك من شأنه أن يؤثر بشكل حتمي على 


هن * 


تفسيرها. 

وبالنسبة للكثيرينء فإن العلوم الإنسانية الرقمية» في هذه الحالة» تعزز التحليلات 
السطحية الضعيفة بدلا من الزؤى العميقة المتخلخلة: ولذاء يتم.نقدها على اختزاليتها 
المفرطة وعدم إتقان أساليبهاء وتضحيتها بالتعقيدء والتدقيق: والسياق» والعمق: ونقدها 
للأماط الوصفية: والآليةء وا مدرجة: وا متسعة. والانطباع ob‏ التفسير لا يتطلب معرفة 
سياقية عميقة. ومن 99 فلقد ادعى )2013( Jenkins‏ أن: "قيمة الفنون وجودة المسرحية 
أو الرسم Y‏ يمكن قياسها على الإطلاق. فأنت بمقدورك وضع جميع أنواع البيانات ف آلة: 
التواريخ» والألوان» والصورء وإيصالات شباك التذاكر. ولكن لا هكن لأي منهم أن يفسر ما 
هو العمل الفنى» وما الذي يعنيه. وما السبب في قوته: فالإجابة عن هذه الأسئلة تتطلب 
إنسانا وليس آلة. وف حين أنني متأكد أن البيانات الكبيرة مفيدة, إلا أنها لا تنطبق على 
جميع مجالات الحياة البشريةء فهى لن تحسن الظروف البشرية. فالحب» والثقافةء والفنء 
والسياسة أمور ضرورية في حياتنا ولكن البيانات الكبيرة تخبرنا القليل عن هذه الأمور. 
وباختصارء لا تصدق جميع الدعايات عن البيانات» فهي ليست الإجابة عن الأسئلة الكبيرة". 
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وعلاوة على ذلك» فإن التمويل المحدود المخصص للعلوم الإنسانية تتم إعادة تركيزه 
على مشروعات العلوم الإنسانية الرقمية وذلك على حساب الدراسات الأكثر تقليدية مما 
يحرم بعض تخصصات العلم من التمويل. وتسري تأثيرات عمليات إعادة توزيع التمويل 
Lj]‏ داخل العلوم الإنسانية الرقمية ذاتها. حيث e‏ غالا ما يتم توجيه التمويل تجاه بناء 
البنى التحتية للبيانات وإنشاء أدوات جديدة, وذلك بدلا من تمويل مشروعات تستفيد من 
المجموعات الرقمية من أجل الإجابة على الأسئلة الأكثر جوهرية. والنتيجة توجيه التمويل 
تجاه هندسة اللرمجيات. وتطوير أدوات تحليليةء ومعدات» ومخترات» ومشروعات الموارد 
الأخرى: وذلك بدلا من تمويل العلوم الإنسانية بذاتها. 

ويمكن أن تنطبق ذات أنواع المناقشات هذه فيما يتعلق بالعلوم الاجتماعية الحاسوبية. 
فعلى سبيل «JULI‏ في مناقشة تتعلق بتأليف التصوير في ويكيبيدياء ادعت فيرناندا فيجاس 
(Frenanda B. Viegas)‏ والتي تعمل في مختبر الاتصالات المرئية في (IBM)‏ أن التخطط 
ا مرئي للبيانات يمكن أن "يساعد الباحثين على تحديد الأسئلة التي رما مكن استكشافها 
من الناحية الاحصائية - على سيل «JUL‏ ما مدى تكرار حدوث التخريب» وما مدى سرعة 
ارتداد النص؟ (مقتبس ف 11 :2010 .(Bollier‏ وعلى الرغم من ذلك» تعد مثل هذه 
الأسئلة بسيطة نسبيا. ففي هذه الحالةء رما يكشف التخطيط db‏ أن موضوعا ما تتم 
مناقشته بحماسة بالغة والمدى الذي يمكن أن يجعل محرري ويكبيديا يتدخلون في عملية 
تحر ير مدخلات البيانات» ولكن التخطيط المرثئي يفعل القليل للإجابة على الأسئلة الأكثر 
فعا وتقنويقا وكقفا coU ul Jis‏ وطبيعة النزاعات والقصص البديلة التي يتم إنتاجها 
ولا تتم دراسة آي منها بشكل أمثل من خلال الإحصائيات. وعلى نحو مشابه» فإن خريطة 
لغة التغريدات في مدينة ما رما تكشف أنماط التركيز الجغراق لجماعات عرقية متعددة 
ولكن الأسئلة امهمة هي من يشكل مثل هذه التركيزات» وما السبب في وجودهاء وما هى 
العمليات التي أسهمت في التشكيل والتكاثر» وما هي نتائجها الاجتماعية والاقتصادية. إن 
تحديد الأنماط iege‏ ؛ ولكن تفسير هذه الأنماط شىء مختلق Lali‏ حيث بتطلب نظرية 
اجتماعيه ومعرفة سياقية عميقة. وق مثل هذه الحالات. فإن الخطر يكمن ف Sgal ol‏ 
همارس ببساطة بسبب توافر البيانات» مما يحد بشكل كبير من الأسئلة التي يمكن توجيهها 
وذلك لأن البيانات م يتم إنتاجها مع وجود مثل هذه الأستلة على البال )2013 .(Vis‏ وكما 
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ادعى )2013( :Gonzalez Bailom‏ "إن تخطيط التوزيع QA‏ للمشاعر الإيجابية؛ 9l‏ 
التكرار الذي يتم من خلاله ذكر بعض الكلمات في التواصل على الإنترنت لا يخبرنا الكثير عن 
توافق هذه الأنماط مع الديناميكيات الاجتماعية التي تشكلها وتخلقها... إن قياس الأشياء 
بسبب أنه ممكن قياسها فحسب» لا يجعلها مشوقة أو ذات صلة". 

وف حالات مثل خريطة التغريدات» فإن الأنماط المكتشفة hab‏ ما يتعين أن تكون نقطة 
النهاية وهو ما يبدو عليه الحال في بعض ال مشروعات )2013 (Rogers‏ والأحرى أن Ji‏ 
الأماط المكتشفة نقطة Ls ilal‏ بتطلب بالتأكيد أشكالا أخرى من التحليلات ورما بعض 
مجموعات السانات الأخرى. 


وكما هو الحال مع الانتقادات الأولى للعلوم الاجتماعية الوضعية الكمية» فإن العلوم 
الاجتماعية الحاسوبية e)‏ بها في مهام من قبل ما بعد الوضعيين كونها آليةء ومفتتة 
ومحددة. وتقلص الأفزاد المتنوعين» والبنى الاجتماعية المعقدة متعددة الأبعاد. إلى مجرد 
نقاط بيانات Wyly)‏ متشور ف الصحافة). 89M eS‏ على ذلك» فإن التحليل يفسد من 
قبل افتراضات الحتمية الاجتماعية كما أوضح )2012( Pentland‏ ذلك بالأمثلة قائلا: "إن 
نوعية الشخص الذي تكون عليه تتحدد بشكل كبير من قبل بيئتك الاجتماعية» ولذا ISI‏ 
كان بإمكاني رؤية بعض سلوكياتكء فيمكنني أن أستنتج الباقي» وذلك فحسب من خلال 
مقارنتك مع الأشخاص في جماعتك". وعلى النقيض من «S05‏ يدعى البعض أن ال مجتمعات 
البشرية معقدة للغاية وفوضوية وغير متوقعة لكي يتم تحويلها إلى صيغ وقوانين» حيث 
توفر النماذج الكمية رؤى قليلة لتفسير الظواهر Jia‏ الحروب» والإبادة الجماعية» والعنف 
الأسريء والعنصرية. وعلى الرغم من أن البيانات الكمية يمكنها أن توضح بعض هذه 
المجالات» فإنها توفر رؤى شاملة فحسس للأنظمة البشرية الأخرى مثل الاقتصاد» وهی 
تفسر بشكل غر كاف دور السياسة: والأيدلوجياء والبنى الاجتماعية؛ والثقافه Harvey)‏ 
à! .(1972‏ الناس لا يتصرفون بطرق منطقية ومحددة تسلف ولكن بدلا من ذلك فهم 
يعيشون حياة مليئة بالتناقضات» وا مفارقات. والحوادث غير المتوقعة. فالكيفية التي يتم 
من خلالها تنظيم وعمل المجتمعات تختلف عبر الزمان واممكان» ولا يوجد شكل Jis‏ أو 
أفضل أو سمات Able‏ وق الواقع» يوجد تنوع مدهش ف الآفرادء والثقافات: EPP ug‏ 
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الحياة على الكوكب. فتقليص Jis‏ هذا التعقيد إلى الموضوعات ام مجردة التي تشغل النماذج 
العاممية يؤدي إلى الكثير من العنف الرمزي فيما يتعلق بخلقنا للمعرفة. وعلاوة على ذلك 
فإن e Ul‏ الوضعية تتجاهل عن عمد امجالات الميتافزيقية La)‏ وراء الطبيعة) للحياة 
البشرية (المتعلقة با معانيء والمعتقدات. والخبرات) والأسئلة المعيارية (ا معضلات الأخلاقية 
وامعنوية بشأن كيف تكون الأشياء على النحو الذي يجب أن تكون عليه مقارنة بالوضع 
الحالى لهذه الأشياء) )2006 .(Kitchen‏ وبعبارة أخرىء فإن المناهج الوضعية تركز فقط 
على أنواع معينة من الأسئلةء والتي تسعى إلى الإجابة عنها بطريقة اختزالية تتجاهل على 
ما يبدو ما الذي يعنيه أن يكون المرء إنسانا وأن يعيش في مجتمعات وأماكن خصبة التنوع 
وهذا لا يعني أن المناهج الكمية غير مفيدة بل هى مفيدة بشكل واضح «oll‏ وخاصة 
فيما يتعلق بتفسير ونمذجة الأنظمة الآلية ولكن ينبغي فهم جوانب قصورها فيما يتعلق 
بفهم الحياة البشرية ودمجها مع ال مناهج الأخرى. 

ومن ثم فلقد ادعى Brooks (2013b)‏ أن تحليلات البيانات الضخمة تتصارع مع 
الطبيعة الاجتماعية كون الناس غير منطقيين ولا يتصرفون بشكل متوقع وكون الأنظمة 
البشرية معقدة بشكل غير معقول ولديها علاقات متناقضة ومتباينة. وهي تتصارع 
EUIS‏ مع السياق كون البيانات منفصلة بشكل كبير عن السياق الاجتماعى» والاقتصادي» 
والسياسيء والتاريخي. وهي أيضًا تخلق أكواما هائلة من القش كونها تتكون من ارتباطات 
غير طبيعية هائلة للغاية مما يجعل من الصعوبة بمكان تحديد مكان الإبرة أو ما نبحث عنه 
وكونها تواجه مشاكل عند مجابهة المشاكل الكبيرة وخاصة المشاكل الاقتصادية والاجتماعية. 
وهي كذلك تفضل ال مستنسخ على الأصل كونها تحدد الاتجاهات ولكنها Y‏ تحدد بالضرورة 
السمات اطهمة التي رها تتحول إلى اتجاه وكونها تحجب القيم وامصالح المتعلقة بمنتجي 
البيانات وهؤلاء الذي يحللون البيانات وأهدافهم. 

وهم يفعلون ذلك لأنه وكما قال )174 :1981( Peter Could‏ وهو مؤيد للمناهج 
الإحصائية في تحليل البيانات: "يبدو أن رموز لغاتنا الرياضية مقيدة ومحددة بشكل كبير. 
وقي الغالب هم يحدثون أضرارا ليس لأنهم يقيدوننا فحسب» ولكنهم في الواقع يمحون من 
الوجود ما يمكن أن يكون مستحقا لانتباهنا واهتمامنا. وإذا ما تصورناء وهذا ما نفعله في 
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الغالب» الطبيعة متعددة الأبعاد التي تصف تعقيد حياتنا المعاصرة... والفراغات الناتجة 
بواسطة الفلتر الخطي (Strainer Called)‏ المسمى تحليل العامل (Factor Analysis)‏ 
فرما نقوم بسحق امعلومات خارج الوجود وذلك تحت مسمىٍ التبسيط. إنني لست 
متأكدا تماما من السبب els‏ فعل ذلكء عدا أن لدي شعورا مؤكدا تقريبا ob‏ توافر أجهزة 
حاسوب كبيرة وسريعة. وكذلك البرامج الجاهزة له يد في ذلك . 


وبالنسبة ل Gould‏ فإن فهم السلوك البشري والمجتمعات البشرية لا مكن ولا يجب 
تحويله إلى تحليلات متكررة ومنهجية وآلية: ولقد دعا إلى التفكير المستدام بشأن أنواع 
الأساليب التي يتعين استخدامها مع أي نوع من البيانات» وتحت أي ظروفء وذلك من 
أجل الإجابة عن بعض الأسئلة المحددة, بدلا من تشغيل البيانات من خلال مصنع نقانق 
إحصان (Sls‏ ينتج الحوما منخفضة الجودة من الألف إلى اليناء بدلا من تقطيع اللحوم 
اطنتقاة. 

وفيما يتجاوز الأملوبٍ المنهجي وال معرفيء فإن جزءا من القضية هو أنه يبدو أن بعض 
تحليلات البيانات الكبيرة تحدث دون وجود أي أسئلة على البالء أو أن يكون التركيز 
T YR‏ هن قزل Aser ok‏ أو ميعنو Nas BLUE eG‏ من dii as‏ هده 3l sl‏ 
تكون مجموعة البيانات مستخدمة من أجل البحث عن إجابات عن أسئلة م يتم تضميمها 
لكي يتم الإجابة عنيا في المقام الأول. وفيما يتعلق بالآخيرء مم يتم إنتاج بيانات تويتر ذات 
لكان المجدد Ll,‏ من أجل تقديم إجابات تتعلق بالتركيز الجغرافي لمجموعات اللغة في 
مدينة ما والعمليات التي تقود مثل هذا الارتباط الآلي المكاني. فنحن يجب علينا ألا نشعر 
بالدهشة رها في حالة ما إذا كانت النتيجة لقطات سطحية فحسب» حتى وإن كانت لقطة 
رائعةء بدلا من ذلك فإن ما يجب أن يدهشنا هو الرؤى المتعمقة والمتغلغلة في جغرافيات 
الجنس» واللغةء والتكتلات» والانعزال في أماكن معينةء ولهذه الأسباب. ستظل دراسات 
البيانات الصغيرة مفيدة. 

وقي معرض الدفاع عن eas al ell‏ من قبل العلوم الإنسانية cda JI‏ ادعى 
Manovich (2011)‏ أن الهدف ليس استتبدال الخراء البشريين بأجهزة الحاسبء ولكن 
الهدف هو استخدام التحليلات من أجل استكشاف مجموعات البيانات الهائلة مثل بلايين 


۲0۰ ثورة البيانات البيانات الكبيرة» والبيانات !9245 «áo‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 





AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


إعادة صياغة بحوث العلوم» والعلوم الاجتماعية» والعلوم الإنسانية 


التغريدات» 9l‏ ملايين الفيديوهات على موقع يوتيوب» 9l‏ عشرات الالاف من الروايات ومن 
ثم اختيار أهداف duzo i LÀ‏ من أجل التحليل !$924 المحكم. وبعبارة أخرىء قان 

منهج العلوم الإنسانية الرقمية يفتح أمامنا إمكانية إجراء الدراسات السطحية على نطاق 
واسع عبر الأشخاص بدلا من الدراسات المتعمقة التي تركز على أعداد قليلة من الأفراد 
.(Manovixh 2011)‏ وبا مثلء: يدعي البعض أن هذ المنهج يوفر العمل الدؤوب للتعمق 
في آلاف صفحات الأخبار ومشاهدة مئات الساعات من البرمجة. لكي "يتمكن الباحثين 
من تركيز طاقاتهم بشكل فعلى على التفسير" )2012 (Harris‏ ولذاء اقترح Flaounas et‏ 
(al. (2013: 111‏ أن: " آتمتة الكثير من eal‏ في تحليل المحتوى الإخباري لن يحل محل 
الحكم البشري المطلوب من أجل أشكال التحليل النوعية والدقيقةء ولكنه سوف يسمح 
للباحثين بتركيز اهتمامهم على مدى أبعد بكثير من أحجام عينة الأشكال التقليدية من 
تحليل المحتوق: وبدلا من قضاء الكثير من العمل الثمين على مرحلة ترميز البيانات الخام» 
مكن للمحليين التركيز على تصميم التجارب وال مقارنات من أجل اختبار فرضياتهم» وآن 
يتركوا لأجهزة الحاسب مهمة اكتشاف جميع المقالات في موضوع «sa‏ وقياس العديد من 
سمات ال محتوى مثل قابليتهم (Sel AU‏ واستخدام أشكال معينة من اللغة والمصادرء إلخ. 
مجرد عدد قليل من المهام التي يمكن أتمتتها في الوقت الراهن". 

وبا مثلء فلقد ادعى )2012( Selisker‏ أن العلوم الإنسانية الرقمية لا تسعى إلى "أن 
تستبدل الأدب برموز الحاسب» أو أن تقايض التعقيد a»‏ بصيغ لا هدف لها. ودلا من 
ذلك» فإن هذه المشروعات تفكر فحسب بطرق إبداعية عن المشاكل التاريخية "Jl io‏ لا 
مكن التعامل معها بسهولة بدون الحواسيب". وبالنسبة ل )2010 ;2003( «Ramsay‏ مكن 
أن تساعد الحوسبة في عملية التفسيرء ولقد ادعى أن القراءة المتأنية تتضمن ممارسات اختيار 
وعزل وملاحظة الأماط ils «oos à‏ ) الترميز ذو كفاءة عالية في مثل هذه الممارسات» 
وعلاوة على US‏ فإن الترميز يقوم بالأمر نفسه بطرق أكثر موضوعية واتساقا من النظرة 
الذاتية «els‏ ودلا من استبدال التعرف على dul (us‏ له فإن توظيف الخوارزميات 
dyus‏ هذه العملية. 
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إن دفاع العلوم الاجتماعية الحاسوبية أمر مختلف تماما في الغالب» ففي حين أن جميع 
العلوم الإنسانية الرقمية تقر بقيمة القراءة المتأنيةء وتؤكد أن القراءة عن بعد تكملها 
من خلال توفير التعمق والسياقيةء فإن الأساليب الموضوعية للعلوم الاجتماعية تتعارض 
مع المناهج بعد الوضعية. إن الفرق بين العلوم الاجتماعية الحاسوبية والعلوم الإنسانية 
الرقمية بهذا الصدد يرجع إلى أن الإحصائيات المستخدمة ف العلوم الإنسانية الرقمية 
وصفية بشكل كبير تحدد الأنماط وتصوغهم كأعداد وصور وخرائط. وعلى النقيض من 
ذلك فإن العلوم الاجتماعية الحاسوبية تستخدم ال منهج العلمي حيث تكمل الإحصائيات 
الوصفية بالإحصائيات الاستدلاليه التي تسعى إلى تحديد السببية. وبعبارة اخرىء فإنها 
تحصل على الدعم من قبل ال معرفة حيث يكون الهدف هو تقديم نماذج إحصائية متطورة 
تفسر وتحاي Loss‏ بالحياة البشرية. ومن الصعوبة بمكان التوفيق بين هذا وبين مناهج 
ما بعد الوضعية: فالدفاع في هذه الحالة يرتكز على فائدة وقيمة الطريقة واممناهج وليس 
على توفير تحليل تكميلي لمجموعة من البيانات أكثر تمددا. 

وهناك بدائل Jb‏ هذا الموقف. مثل البديل الذي تم تبنيه في نظم المعلومات الجغرافية 
(GIS)‏ والإحصائيات الجذرية (Radical Statistics)‏ وهؤلاء الذين يستخدمون مناهج 
ذات طرق مختلطة. وهذا يتضمن إما توظيف النماذج والإحصائيات الاستدلالية شريطة 
أن يكون هنالك إدراك لمواطن الضعف فيهماء csl‏ كما يحدث على نحو شائع: استخدام 
الإحصائنات الوصفيّة التى kasus‏ دراسات البيانات الضغيرة. ‏ وهناء يتم'استخداغ كل من 
البيانات الكبيرة والبيانات الصغيرة من أجل توفير رؤى مختلفة ولكن تكميلية. وبغض 
النظر عن مثل هذه ALLII‏ فإن الكثير من علماء ما بعد الوضعية سوف يستمرون في 
مقاومة البيانات الكبيرة والمناهج الإحصائية بأشكالها المتعددةء وبلا شك فإن المجادلات 
سوف تتسارع وتيرتها في المستقبل المنظور. 
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إعادة صياغة بحوث العلوم» والعلوم الاجتماعية: والعلوم الإنسانية 


الخاتمة: 

هناك شكوك قليلة بأن ثورة البيانات أتاحت احتمالية إعادة التشكيل الممعرف للعلوم 
والعلوم الاجتماعية والإنسانية» وأن مثل إعادة التشكيل هذه تحدث بالفعل بشكل فعال 
ونشط. فالبيانات الكبيرة وتوسع البيانات الصغيرة من خلال البنى التحتية للبيانات يساعدان 
على تنفيذ مناهج جديدة تجاه إنتاج وتحليل البيانات» مما يجعل من الممكن توجيه الأسئلة 
والإجابة عنها بطرق جديدة. وقد شجع هذا البعض على الادعاء بشكل جريء Ob‏ ثورة 
البيانات هي ابتكار تدميري يعلن عن 4US‏ نوعية في كيفية إجراء البحوث. وهذه بالقطع 
هى الحالة حيث إن التحول من صحاري البيانات إلى طوفان البيانات وتحليلات البيانات 
الجديدة سيغير الممارسات البحثية. وعلى الرغم من ذلكء يتعين أخذ الحيطة عند القيام 
بتأكيدات تتعلق بإعادة تشكيل البحث وبأفضل طريق مكن اتباعه في إعادة التشكيل هذه. 

إن العلم يعامل بشكل سين من قبل الادعاءات القائلة بآن ثورة البيانات تعني "أن 
البيانات يمكنها أن تتحدث عن نفسها" أو أنه يمكنها بدون أي مشاكل استخدام أساليب 
مثل تجريف البيانات حيث يسبق الارتباط السببية» (انظر الفصل التاسع). وتعد المناهج 
التي يتم تطويرها داخل العلوم المقادة بالبيانات والتى تمزج بين الاستدلالء والاستنتاج 
والاستقراء أكثر إنتاجية بكثير. حيث تتم إعادة تشكيل الطريقة العلميةء وذلك بدلا من 
تدميرهاء إن الأسس الفلسفية للعلم المقاد «bU Jb‏ على الرغم من ذلكء لا تزال في أطوارها 
التمهيدية وهناك حاجة للتفكير ال مستفيض في معتقداتها المعرفية ومبادئها ومنهجيتها. 

أما الموقف فيما يتعلق بالعلوم الاجتماعية والعلوم الإنسانية فهو أكثر تعقيدا بشكل ما 
وذلك إذا وضعنا في الاعتبار تنوع الأسس الفلسفية لهذه العلوم» حيث إنه من غير ال محتمل 
أن تقود ثورة البيانات إلى تأسيس نموذج جديد. وبدلا من ذلك فإن البنى التحتية للبيانات 
وثورة البيانات سوف يعززان مجموعة البيانات المتوافرة للتحليل ويمكنان مناهج وأساليب 
جديدة: ولكنها لن تحل محل دراسات البيانات الصغيرة. وفيما يتعلق بالعلوم» هناك 
حاجة لتفكير نقدي أوسع ف الآثار المعرفية لثورة البيانات على العلوم الاجتماعية والعلوم 
الإنسانيةء وهذه المهمة بدأ بالكاد التعامل معها وذلك على الرغم من سرعة التغيير الحاصل 
في مشهد البيانات. 
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الفصل التاسع 
القضايا الفنية والتنظيمية 


(Technical and Organizational Issues) 


كما ناقشنا في الفضلين السابقين. توفر البنى التحتية للبيانات ومبادرات البيانات 
المفتوحة وإنتاج البيانات الكبيرة فرصا جديدة لقياس وفهم العالم. وهي أيضًا تثير قضايا 
فنية وتنظيمية. وتطرح أسئلة معيارية وأخلاقية. وفي هذا الفصلء سيتم التركيز على الأمر 
الأولء ما يعني التركيز على بعض القضايا مثل مجال مجموعات البيانات» والوصول إلى 
السيانات» وجودة السانات» وتكامل السباناتء والتبادلية (القابلية (JLU‏ وتطبيق التحليلات 
والمغالظ ات didi‏ والمهارات والقدرات والإمكانات التنظيمية. فبعض هذه القضايا مكن 
التعامل معها من خلال الحلول الإدارية والفنية» في حين أن البعض الآخر من هذه القضايا 
تمثل مشاكل عسيرة الحل ومن الصعب التعامل معها. وعلى الرغم من ذلكء فإذا كانت 
القضايا المتعلقة بجودة البيانات وال مغالطات البيثية لا مكن التعامل معها بشكل كافء 
ففي هذه الحالة لا يهم ماهية النظريات المعرفية التي يتم تطبيقهاء (انظر الفصل الثامن)» 
y‏ التحليلات والتفسيرات ستكون محل ارتياب. وعلاوة على ذلك» فإذا كان الوصول إلى 
البيانات مقيدا بشكل كبيرء أو إذا كانت الحكومات والشركات والمجتمع المدني يفتقرون 
المهارات الكافية لإدراك المغزى من هذه البيانات» ففي هذه الحالة ستكون قيمة ومنافع 
البيانات المفتوحة والكبيرة المتدرجة مقيدة بشكل كبير للغايه. ونتيجة لذلك» فإن القضايا 
التي تمت مناقشتها في هذا الفصل لا يمكن تجاهلها أو إبعادها بسهولةء ومن ثم فهي 
تتطلب الاهتمام البالغ. وفي الفصل التاليء سيتحول التركيز إلى قضايا سياسية واجتماعية 
أعم وأشمل والتي تتعلق بإنشاء ومشاركة وتحليل واستخدام البيانات مع الوضع في الاعتبار 
الأبعاد الأخلاقية: والقانونية: والأمنية لثورة السانات. 
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الصحاري والفيضانات :(Deserts and Deluges)‏ 
في كافة النقاشات الدائرة بشأن 8555 البيانات يكون ف الغالب من الصعب تحديد مصدر 
مجموعة مناسبة من البيانات فيما يتعلق بالكثير من الظواهرء وبخاصة تلك البيانات التى 
تغطي فترات زمنية طويلة ومتأصلة مكانيا. وبشكل «dye‏ فإن هذه تعد قضية من قضايا 
التغطية من ناحية» ومن قضايا الوصول من ناحية أخرىء فمن جانب التغطيةء فإن جميع 
مصادر البيانات محددة من ناحية العينةء وا مدى الجغرافيء «3391s‏ ومتغيرات الصفات 
(الحقول) والمؤشرات. وف الواقع» فإن العام معقد بشكل كبير لغاية أنه يستحيل التقاط 

نطاق كامل وكافة فروقاته الدقيقة» وتناقضاته: وتبايناته. 

إن البيانات التى يتم جمعها من خلال دراسات البيانات الصغيرة تعد عينات بشكل 
صريح للغاية» وهي تجمع بشكل غير مستمرء وهي ذات رقم محدد من المتغيرات وذلك 
بالنظر إلى تركيزها المحكم والتكلفة المرتبطة بالجمع والتحليل» فمعظم هذه الدراسات 
Lë‏ دراسات sl‏ تجارب منفصلة تركز على قضايا وحالات معينة لمجموعة: مؤسسة. آنواعء 
أماكن» تقنيات... إلخ. وهي تفتقر إلى المكون الطولي حيث إنها Y‏ تغطي فترات زمنية 
متعددة وطويلة. فالدراسات التي تقوم بدراسة التغييرات بمرور الوقت عادة ما يتم 
تكرارها على فترات محددة. وف هذه الحالة: فإن فهمنا لظاهرة معينة عادة ما يعتمد 
على مجموعه مقيدة من البيانات» وحتى عندما يتم تجميع 443,59 مجموعات البيانات 
داخل البنى التحتية للبيانات» فإن التغطية تكون جزئية وانتقائية. فعلى سبيل JALI‏ فإن 
مجموعات بيانات الإدارة العامة الأيرلندية ذات تغطية محدودة وهي مملوءة بالفجوات 
والسكنات عن قطاعات duszo‏ مثل قطاعات الإاسكان والنقلء وغالا ما يتم الاحتفاظ بها 
داخل المؤّسسات )2007 (Kichin et al.‏ 

وعلى نحو مشابه» فإن البيانات الكبيرة رها تميل إلى أن تكون بيانات شاملةء ولكن وكما 
هو الحال مع مجموعات البيانات الأخرىء فإن كلتيهما تكون تمثيلا dusg‏ وهی تحل» 
بشكل جزني فحسب» قضية صحراء البيانات التي يقصد بها أن تكون البيانات موزعة على 
مجاميع بيانات متفرقة يصعب استقاء البيانات منها أو إضافة بيانات اليها. وكما لاحظنا 3 
الفصل الثاني» فإن البيانات التي يتم التقاطها تتشكل من قبل التقنية المستخدمة: والسياق 
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القضايا duill‏ والتنظيمية 


الذي تم فيه إنشاء هذه البيانات» وتوصيف البيانات الذي تم توظيفه. فالبيانات المنشئة 
Ji‏ عادة ما يمكن التقاطه إلى حد ما بطريقة مباشرة. وهي تكون في غالب الأحيان منتجا 
فرعيا للنظام» ويكون مجالها الفوري مقيدا من قبل النطاق كسلاسل الأسواق المركزية 
وشبكات «Dl s al‏ ومواقع التواصل الاجتماعي. وفيما يتعلق بالعلوم: فإن البيانات 
الكبيرة يتم إنشاؤها حاليا U‏ يتعلق بمجموعة منتقاة من ا موضوعات فقطء وهي بعيدة 
كل البعد عن أن يتم إنتاجها عبر جميع النطاقات والبؤر العلمية. وعلاوة على US‏ فإن 
القرار فيما يتعلق بإنشاء البيانات الكبيرة لم يتشكل بعد ولكنه يتطور ويتركز من أجل توفير 
مجموعة من الرؤى. بحيث تشكل كل واحدة منها بعضاً من العناصر التي يتم التقاطها 
كالاتساع» والعمقء والتفاصيل... إلخ. وحتى عندما يتم دمج بيانات كبيرة مع مجموعات 
البيانات الأخرىء فإن مجالهم يكون la aso‏ كل البعد عن كونه مجالا عالميا. ولذاء فإن 
البيانات الكبيرة» في هذه الحالةء لا تعالج مسألة صحاري البيانات وذلك فيما يتعلق بالكثير 
من مجالات الدراسة. 

وف الوؤقت:نفسه. وف حَين أن «joue‏ البيانات فازال تواجدها اممشتتمراء OB‏ البنى 
التحتية للسيانات والسانات الكبيرة أنشاًا طوفانا من البيانات في بعض المجالات. وكما لاحظنا 
في الفصل ul JI‏ كان هناك (WEE ad‏ في حجم وسرعة إنتاج البيانات والتي تم تحديدها 

من ol Jel‏ تنمو بسرعة Ale‏ وذلك مع إنشاء وبدء المصادر الجديدةء وتعقد مجموعات 
البيانات التي تم إنتاجها: وانلقدرة على ربط السانات paso‏ التعض» اومن 'شأن هذ الطوفان 
أن يفرض عددا من التحديات فيما يتعلق باطناولهء وا معالجه» والتأمين, والتصنيف» والفهم 
| هذه السانات )2011 (Gantz and Reinsel‏ وبدلا من مجموعات السيانات الصغيرة 
وغير Sall‏ 5( يحاول المحللون الاستفادة من الكميات الهائلة من البيانات التي يتم تدفقها 
من أنبوب سميك. فمعظم هذه البيانات أصبحت بيانات عابرة وتم فقدهاء وم يتم أبدا 
تحليلها أو الاستفادة منها. وبعض هذه البيانات قد تم تخزينها في مستودعات البيانات 
التى تمثل إلى حد كبير مكبات غير مراقبة للنفايات )2013 (Asay‏ وهناك يتم الإبقاء عليها 
حتى تأق أوقات مكن لهذه البيانات أن تقدم فيها معلومات مفيدة. ونتيجة لذلكء وبينما 
تزداد نسبة البيانات بشكل تصاعديء فإن نسبة البيانات التي يتم معالجتها وتحليلها تقل 
بشكل .(Zikopoulos et al 2012) S‏ وقد أشار )2012( Wu‏ إلى أنه في الوقت التى 
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الفصل التاسع 


تزداد فيه البيانات» يتم الحصول على معلومات أقل كنسبة من هذه البيانات. وبعبارة 
$521« تزداد ضوضاء السانات بشكل كبير للغاية ولكن إشارات المعلومات تنمو بشكل أقل 
TT‏ وعلاوة على ذلك. يصبح يصبح الأمر أكثر صعوبة لعزل هذه البيانات في خضم هذه الضواء 
(انظر 2012 T (Silver‏ بلا جدال وظيفة البيانات الكبيرة وعلم البيانات حيث لا 
يزالان في أطوارهما الأولية» ومع الاستغلال الكامل للأساليب الحديثة والتي بإمكانها مراقبة 
ومعالجة وتحليل كميات هائلة من البيانات بشكل آني أو لحظي إلا أن هذا من المتعذر 
تحقيقه بشكل كبير. وحتى مع نضوج وتطور تحليلات البيانات الكبيرة فإنه من المرجح أن 
تعاني من أجل تطوير طرق ومناهج يمكن من خلالها استخلاص التحليلات المفصلة وليست 
التحليلات السطحية؛ والتعامل مع أسئلة "SU"‏ وكذلك أسئلة "ماذا"؛ وتقديم إيضاحات 
وليس شروحات (انظر الفصل الثامن). وعلاوة على CUS‏ يتعين تنويع هذه الطرق وذلك 
من أجل مجاراة الأشكال الجديدة من البيانات التي يتم إنشاؤها من قبل المصادر المبتكرة. 
وحتى مع تحقيق US‏ فإن مجاراة طوفان البيانات واستخلاص إشارات ذات مغزى من 
الضوضاء سيكون كفاحا EA‏ 


الوصول (Access)‏ : 
إن العائق الأساسي الآخر أمام الاستعانة مصادر مجموعات مناسبة للبيانات هو مدى 
قابلية الوصول إلى هذه ال مجموعات وقيود التراخيص التي تحدد معايير استخدام تلك 
المجموعات. وبشكل واضح. وكما ناقشنا في الفصلين الثاني والثالث» فإن الوصول يعتبر 
قضية أساسية فيما يتعلق بالبحوث والبيانات الممولة من قبل المؤسسات العامة والتي 
تنشئها nap‏ العامة» فمحفوظات المسيانات والبنى التحتية OLLU‏ ومبادرات SEM,‏ 
المفتوحة تعني وتهتم بشكل كبير Uie‏ 45 وإنتاج السانات المتاحة للتحليل. وكما أوضحت 
المناقشات à‏ الفصول المشار إليها Ble‏ فعلى الرغم من حقيقة أن البيانات غير تنافسيةء 
وغبر قابلة للاستثناء أو الإقصاءء ولها تكلفة هامشية عند استنساخها )2010 (Floridi‏ إلا ol‏ 
البانات مقيدة ة بشكل شائع وذلك عند توزيعها. وق بعض الأحبانء فإن الوصول المقيد إلى 
النافات كن lel‏ مرغوبا فيه. وذلك إذا وضعنا في اعتبارنا طبيعتها الحساسية والشخصية 
وكذلك البعد الأخلاقي المرتبط بنشر واستخدام هذه البيانات (انظر الفصل العاشر). às‏ 
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أحيان 5,51« يكون الوصول إلى البيانات مقيدا لأجل التأكد من أن هؤلاء الذين يحتفظون 
بهذه البيانات سيرفعون من قيمة هذه البيانات ويضيفون ميزات تنافسية لها أو يحققون 
أموالا من خلال البيع او الترخيص للوصول لهذه البيانات (انظر الفصل السابع). وف أحيان 
أخرىء رما ترغب إحدى الهيئات في تقييد توزيع البيانات نتيجة أنها تخشى ما يمكن أن 
تكشفه هذه البيانات» والذي رها يكون له تداعيات سياسية أو اقتصادية» أو يكون مرد 
ذلك الخوف من كشف تدني جودة البيانات التي كانت محفوظة. 

s‏ حين أن هذه المعوقات بدأت تتلاشى ببطء فيما يتعلق بالبيانات الممولة والمستحدثة 
من قبل المؤسسات العامة في الدول الدمقراطية الغربية: إلا أن مثل هذه التحركات تعد 
أكثر تقلبا مع تلك البيانات المستحدثة من قبل المؤسسات الخاصة. وف الواقع: فإن هذا 
الأمر يعد متناقضا إلى حد ماء إذ إنه على الرغم من طوفان البيانات الكبيرة الناشئ. إلا 
أن الوصتول إلى مثل هذة:البيانات يظل مقيدا ومحدودا في الوقت الحال» وذلك بوجود 
عدد محدود للغاية من الكيانات الغارقة في مثل هذا الطوفان والتى يمكنها الوصول 
إليه )2011 (Crawford 2012, King‏ فالشركات من أمثال مشغاى الهواتف الخلوية 
ومطوري التطبيقات» ومزودي وسائل التواصل الاجتماعيء وا مؤسسات AJU‏ وسلاسل 
التجزئة» وشركات ال مراقبة والشركات الأمنية: لا يقع على كواهلها أي التزامات لمشاركة 
البيانات التي يستحدثونها من خلال عملياتهم التشغيلية بحرية. وعادة ما يتم التفاوض 
للوصول إلى البيانات بشكل فردي وهذا يتضمن توقيع العديد من اتفاقيات حماية LSL‏ 
الفكرية واتفاقيات عدم الإفصاح» وكذلك الموافقة على الشروط والبنود التى تحدد كيف 
وف آي غرض سيتم استخدام أو لا يتم استخدام مثل هذه البيانات. وحتى بعد كل dis‏ 
فمن المحتمل أن تمثل البيانات التي يتم توفيرها عينة محدودة: كما من الممكن أن تفتقر 
هذه البيانات إلى المعلومات السياقية مثل الكيفية التي تم تعيين هذه البيانات من خلالهاء 
أو تكون البيانات غير معالجة بشكل كبير أي م يتم تنقيتها أو هيكلتهاء أو تكون مجمعةء 
أو مجردة من المتغيرات dubl‏ أو معالجة JS zo‏ أو بآخرء وذلك من شأنه أن يقيد 
أساليب تحليل هذه البيانات. وف بعض الحالات» يمكن أن يتم إتاحة كمية محدودة من 
البيانات LU‏ 34( والجمهور وذلك من خلال واجهات برمجة التطبيقات Application)‏ 
(Programming Interfaces -APIs‏ فواجهات áp‏ التطبيقات تتكون من مجموعة 
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من الأوامر التي يمكن استخدامها من أجل استعادة البيانات المخزنة في قواعد بيانات على 
خادم متاح الوصول aJl‏ للجمهور )2011 .(Manovich‏ فعلى سبيل «JUL‏ يسمح تويتر 
لعدد محدود من الشركات بالوصول إلى كافة ساناته المتدفقه عبر deiga‏ وذلك مقابل 
رسوم أو لأغراض تجارية. وهو يتمتع بالصلاحيات التي تسمح له بإملاء شروطه فيما 
يتعلق بالأغراض التي يمكن فيها استخدام مثل هذه البيانات. فالباحثون يتم تقسيمهم 
إلى قسمين: القسم الأول يمكنه الوصول إلى *٠١‏ من التغريدات العامةء والقسم الثاني لا 
مكنه الوصول إلا إلى >١‏ فحسب من التغريدات العامة» أو يمكنهم الوصول إلى مجموعات 
فرعية مختلفة من المحتوى (الحسابات المدرجة ف القائمة البيضاء). وذلك مع استبعاد 
التغريدات الخاصة والمحميه في جميع الأحوال )2012 .(boyd and Crawford‏ وي 
حال المواقع الإلكترونية التي تحوي على سبيل JULI‏ قوائم منتجات وتقييماتها Product)‏ 
(Listings and Reviews‏ وأدلة أعمال (Business Directories)‏ وكذلك في حال وسائل 
التواصل الاجتماعي والتي تتضمن الملفات الشخصية العامة (Public Profiles)‏ والتغذية 
(Feeds)‏ فإن بعض الشركات مثل (80legs) (www.80legs.com)‏ وشركة Mozenda))‏ 
((www.mozenda.com‏ توفر خدمات زاحف الشبكة sl)‏ تصفح الشبكة العاطية بطريقة 
منهجية وآليه ومنظمة) وتجريف الشبكة (أي استخراج البيانات من مواقع الإنترانت عن 
طريق برامج مخصصة ) لحصد بيانات مفصلة من هذه المواقع أو للوصول لبيانات تغذية 

وما يقلق في هذا الأمر هو أن المعلومات التي يمكن أن توفرها البيانات الكبيرة المملوكة 
للشركات الخاصة والتي تم بيعها بشكل تجاري سوف تكون محصورة على قطاع الأعمال 
فحسب» أو رها يتم إتاحتها لمجموعة مميزة من الباحثين الأكاديميين الذين لا مكن تكرار 
النتائج التي توصلوا إليها أو التحقق منها )2011 .(Lazer et al. 2009; King‏ ولا أحد 
من هذه المواقف يخدم المصلحة العامة ولكن إذا وضعنا ف اعتبارنا القيمة التجارية 
للبيانات محل المناقشة فإن زيادة الوصول إلى هذه البيانات لن يكون مهمة سهلة أبدا. 
فحقيقة أن البيانات الكبيرة الثرية من الناحيتين الاجتماعية والثقافية مملوكة للشركات 
الخاصة تشير إلى أنه في الوقت الحالى لن يكون من السهل ف الواقع إجراء بحوث العلوم 
الاجتماعية الحسابية والعلوم الإنسانية الرقمية )2011 LSS .(Manovich‏ ذكر كلا من 
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boyd and Crawford (2012: 673)‏ فإن " الكثير من الحماس الذي يحيط بالبيانات 
الكبيرة ينبع من الإدراك القائل بأن هذه البيانات توفر وصولا سهلا لكميات هائلة من 
البيانات. ولكن من يتمتع بمثل هذه القدرة للوصول إلى هذه البيانات؟ ولأى غرض يتم 
الوصول؟ وق si‏ سياق يجرى هذا الأمر؟ وما معوقات الوصول؟" فهذه أسئلة تتطلب 
الكثير من التفكير مع اتخاذ إجراءات مناسبة. 


جودة وصحة وأصل السانات :(Data Quality, Veracity and Lineage)‏ 
$352 وصحة البيانات هما أمران مهمان للغاية كونهما يعززان المدى الذي يمكن أن يثق 

فيه المرء بالنتائج المستخلصة من تحليل البيانات. وترتبط جودة البيانات بمدى تنظيمها 
أي خلوها من الأخطاء والفراغات» ونقائها أي خلوها من التحيزء وتماسكها معنى أن $923 
القليل من التناقضات. بينما يشير مصطلح صحة البيانات إلى موثوقية البيانات وإلى مدى 
تمثيلها للمعنى الذي : تشير اليه بدقة (إتقان) وأمانة (إخلاص). ولهذا فإن تأسيس وتوثيق 
جودة وصحه اليانات يعتير شقا àv; à Tn‏ أصل السانات. فمُّلالة أصل البيانات e‏ 


المعلومات التي تصف مصدر ال ملاحظات. والمنهجيات التي خضعت لها البيانات عند 
جمعها وتصنيفهاء والتعديلات» والتحولات» والتحليل» والاشتقاقات التي تعرضت du‏ وهي 
توفر أيضا الافتراضات وا معايير التي تم تطبيقها عند أي مرحلة من مراحل حركة هذه 
البيانات» وكذلك أي تحيزات... وتوفر سُلالة أصل البيانات مجموعة بيانات مع أصلها 
وتسمح للمستخدم أن يحدد مدى ملاءمه البيانات للاستخدام )2012 (Lauriault‏ 

وهي أيضا تصف بالتفصيل منشأ البيانات» ومن شأن الجودة والصحة وسُلالة الأصل 
الضعيفة للبيانات أن يقوضنّ درجة الثقة والمصداقية التي يمكن أن يضعها الشخص في 
مجموعة البيانات والتحليلات التي اعتمدت على هذه البيانات. 

ومن الناحية التقليديةء فإن الدراسات القائمة على بيانات نادرة والتي يكون حجم 
TERN‏ في الغالب» فإن جودة وصحة وأصل البيانات تكون على قدر كبير 
من الأهمية. .1518 كان الشخص سيعمل على استخلاص نتائج عن السكان بالكامل وذلك 
اعتمادا على عينة مثالية صغيرةء فإنه يتعين في هذه الحالة أن تكون العينة واضحة للغاية 


ثورة السانات السانات الكبيرة: والسانات المفتوحة؛» والىنى التحتىة للسانات» والنتائج ج المترتة عنها Y?‏ 
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وخالية من العيوب بأكبر قدر ممكنء ويتعين أن تكون على درجة عالية من الدقة والصحة. 
وعلى e£ JI‏ من US‏ فإن عدد مجموعات البيانات يتم تشكيلها بشكل تام محدود للغايةء 
ويمكن استخدامها بدون أي شكل من أشكال تنظيف البيانات» بمعنى التحقق من الأخطاء 
وتصحيحهاء وإضافة البيانات المفقودةء ومعايرة وإعادة تهيئة البيانات حتى يمكن ربطها 
مع بيانات أخرى أو لتكون هذه البيانات سهلة الاستجابة لمناهج تحليل معينة (انظر 
الفصل السادس). ولذاء فإنه يتم استهلاك الكثير من العمل خلال تصميم البحث من 
أجل تقييد التحيزات المنهجية والتحيزات المرتبطة بتحديد العينات S‏ يتم التأكد من أن 
البيانات دقيقة وذات مصداقية بقدر الإمكان قبل تحليل أو مشاركة هذه البيانات. وتعمل 
المحفوظات الأرشيفية والبنى التحتية بشكل نشط من أجل التأكد من أن تظل مثل هذه 
البيانات ذات مصداقية ودقيقة وصحيحة مرور الوقتء مع المحافظة على سّلالة أصل 
البيانات من خلال الاستقرار المؤسسيء وعمليات إدارة البيانات وواصفات البيانات» وتمكين 
نقل البيانات عبر مختلف الصيغات والمنصات مما يحقق الؤامة بين الأجيال المختلفة من 
التقنيات )2012 .(Lauriault‏ وبدون مثل هذا العملء فإن صحة الببانات المتضمنة داخل 
تلك البيانات سوف تتلاثى في القريب العاجل وذلك مع اتعدام الثقة. 


وعلى النقيض من 5« ادعى البعض أن دراسات السانات الكبيرة ليست بحاجة إلى 
تطبيق معايير جودة وصحة البيانات ذاتهاء وذلك يرجع إلى أن الطبيعة الكلية طمجموعات 
البيانات الكبيرة "25 الجميع" n-all)‏ ( تجعلها تتخلص من التحيزات المتعلقة بتحديد 
العينات» وتقوم بالتعويضء أكثر من ال مطلوبء. عن أي أخطاء أو ثغرات أو تناقضات في 
البيانات أو أي ضعف في dmo‏ البيانات )2013 .(Mayer-Schonberger and Cukier‏ 
فالحجة التي استندت إليها وجهة النظر هذه أنه "مع وجود عدد قليل من الأخطاء ال مرتبطة 
بتحديد العينةء يمكننا تقبل أخطاء أكبر مرتبطة بالقياس" (ص 13( "ويمكننا التسامح مع 
عدم الدقة" (ص 16). إن الثمن المقابل ل "ن- الجميع" (nal)‏ هو قبول الفوضى التى 
نشأت بشكل كبر من جراء صعوبة CAJAS‏ السانات ذات السرعة العالية وغير اللنظمة. 
وتقبل البيانات كونها "محتملة أكثر من كونها دقيقة" (ص 35). وعند النظر إلى الأمر 
oap‏ الطريقة»› ادعى )2013 (Mayer-Schonberger and Cukier‏ أنه " كلما كان هنالك 
بيانات أكثرء كان ذلك أفضل" أو للتعبير عن هذا الأمر بشكل آخرء "إذا كان لديك بيانات 


۲1۲ ثورة البيانات البيانات الكبيرةء والبيانات «áo zb!‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها 
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كقرة هد قإنا às jus Ju 92 ls‏ كاقة js .(Helland 2011) "LàlS à»; li Ass‏ 
تم فقد ادعى )211 :2012( Franks‏ أن المطلوب هو 'بيانات نظيفه بدرجه 44385« وهي 
البيانات التي تمكن المحللين من "الحصول على النتائج التي مكنهم الوثوق بها". وبالطبع 
فإن هذا يفترض أن جميع استخدامات البيانات الكبيرة سوف تتسامح مع عدم الدقةء في 
حين أن الواقع يشير إلى أن الكثير من استخدامات البيانات الكبيرة تتطلب الدقة بشكل 
ous‏ أو على الأقل بيانات ذات معايير الأخطاء التي يمكن حسابها أي بيانات موثوقة. فعلى 
سبيل JELI‏ فإن موقع خريطة الطريق ال مفتوح (OpenStreetMap)‏ يهدف إلى òl‏ يكون 
في مستوى منتجات الخرائط الاحترافية من حيث التفصيل والدقة. ويهدف كذلك إلى كسب 
AÈ‏ مستخدمىه كونه luas‏ من مصادر المعلومات. وعلى النحو ذاتهء تهدف موسوعة 
ويكسيديا (Wikipedia)‏ إلى أن تكون موسوعة دقيقة وموثوقة Jis‏ موسوعات الأخرى. 
وبطريقة مماثلة يتعين أن تكون البيانات المالية والبيانات الطبية دقيقة وصحيحة من أجل 
أن تغرس الثقة في نفوس التجار والأطباء والمرضى... والقائمة تطول. فمثل وجهة النظر هذه 
تفترض أيضا أن H‏ أصل البيانات وقضايا صحة وموثوقية البيانات ليست مهمة بالنسبة 
مستخدمي البيانات. 
وبغض النظر عن تسامح بعض مجموعات بيانات البيانات الكبيرة تجاه عدم «43JJl‏ إلا 
odes ol‏ المعطيات الزيئة $555 إلى مخرجات زيئة الاايزال iib Ls‏ فمجموعات البيانات 
الكبيرة التي تنشئ بيانات معيبة ورديئة» وتم التلاعب بها ومتحيزة: أو تنشئ بيانات ذات 
مصداقيه ضعيفة» سوف تؤدي إلى تحليلات ونتائج ذات مصداقيه ضعيفة وسوف OSS‏ 
الفوائد المرجوة منها قليلة للغاية بالنسبة لهؤلاء الذين يحللون ويستفيدون منها. ويمكن 
للبيانات الكبيرة» عن طريق طرق إنتاجهاء أن تعاني من جميع العلل فالبيانات يمكن أن 
تكون duse‏ ورديئة من خلال أخطاء SYI‏ حتى عبر التقنيات التي يفترض أن تكون ذات 
دقة عالية للغاية مثل نظام التموضع العالمي (GPS)‏ والذي تختلف دقته من جهاز لآخر 
وعدد الأقمار الصناعية المتوافرة في وقت معين من الأوقات )2013 (Dodge and Kitchin‏ 
أو من الممكن أن يكون قد تم التلاعب أو التزوير في البيانات من خلال حسابات مزورة أو 
القرصنة من أجل التأثير على الاتجاه العام وتوجيه العامة نحو مسارات محددة )2013 (Vis‏ 
فعلى سبيل JUL‏ هناك مئات الآلاف من الحسابات المزيفة على «jog‏ وهي تشكل ٤.٥‏ 


ثورة البيانات السيانات الكبرةء والسانات cáo gx AUI‏ والىنى التحتية للسانات» والنتائج 5& عنها pr‏ 
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من ul‏ حسابات ال مستخدمين على تويتر )2013 (De Micheli and Stroppa‏ وأيضا فان 
حتى XEO‏ من حسابات بعض العلامات التجارية لمتابعي تويتر هي حسابات آلية Calzolari)‏ 
2012( وأكثر من درزنين من الخدمات تبيع حسابات تويتر مزيفة )2013 (Baym‏ 

فالبيانات يمكن أن تتسم بالتحيز جراء بعض الأسباب. إن الخصائص السكانية التى 
يتم اختيارها في العينات نادرا ما تكون شاملة 239 69 Das]‏ من قبل الجنسء والنوع 
والدخل» والموقع: والعديد من العوامل الاجتماعية والاقتصادية الأخرى. فليس جميع 
الأشخاص يستخدمون تويتر أو الفيسبوك أو يتسوقون من محلات معينة. أو يكونوا 
مشتركين في شبكة الاتصالات ذاتها... Bollier 2010; Graham 2012; Crampton) eJ]‏ 
.(et al 2012‏ فالتقنية المستخدمة وال معايير ال مطبقة 58 على طبيعة السبانات. فعلى 
سسيل المفال#امكن أن Slo‏ تحديد المشاركات الأكثر قراءة أو مشاركةاقلن,وسائل التواضل 
الاجتماعي بشكل كبير من خلال خوارزميات الترتيب وليس الاهتمامات البسيطة Baym)‏ 
2013(. وعلى النحو ذاتهء فإن واجهات برمجة التطبيقات تنظم ماهية البيانات التي يتم 
استخلاصهاء ففي تويتر» على سبيل JULI‏ يتم التقاط الوسم ال مرتبط بالحدث وليس جميع 
التغريدات ذات الصله )2013 täl (Burns‏ فقد بين Gonzales - Bailon et al)‏ 
2) أن اختلاف طرق الوصول إلى بيانات تويتر - البحث في واجهات برمجة التطبيقات 
مقابل تدفق واجهات برمجة التطبيقات - يؤدي إلى الحصول على مجموعات مختلفة من 
النتائج. ونتيجة «JJ‏ لا توجد أي ضمانات بأن فريقين من اللاحثين: e‏ سبيل «JULI‏ 
الذين يحاولون جمع البيانات ذاتها في الوقت ذاته سوف يكونون قادرين في نهاية ا مطاف 
على الحصول على مجموعات السانات ذاتها )2013 .(Burns‏ وعلاوة على US‏ فإن اختبار 
البيانات الوصفية وامتغيرات التي يتم توليدها والبيانات الوصفيه وامتغيرات التي يتم 
تجاهلها يؤدي إلى رسم صورة معينة. ومثل هذه التحيزات تؤدي إلى انحراف أو حتى إلى 
نشوء أفكار واتجاهات وأشخاص ونماذج مستترة لم يتم تصويرها أو تمثيلها في مجموعة 
السانات )2012 (Graham‏ 

وفيما يتعلق بمصداقية البيانات» فإن الحال Y‏ يتمثل دوما في أن البيانات تعبر بصدق 
عما تم استخدام البيانات من أجل قياسه. فعلى سبيل JLI‏ هناك علامات استفهام 
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حول مدى حقيقة ودقة تعبير المشاركات في وسائل التواصل الاجتماعي عن وجهات نظر 
الأاشخاص» وعلى مدى (3959Jl‏ في مثل هذه المشاركات. وقد حذر (2011:6) Manovich‏ 
قائلا إن "المشاركات. والتغريدات» والصور التي تم تحميلهاء والتعليقات» وجميع الأشكال 
امختلفة من المشاركات على الإنترنت لا تعتبر نوافذ شفافه بذاتهاء وبدلا من US‏ فهي غالا 
مرتبة بعناية وتتم إدارتها بشكل منتظم وذلك من خلال الانتقادات نفسها التي تنطبق على 
سانات المقابلات ومجموعات التركيز" .(Focus Group)‏ وأبدى آخرون شكوكهم حيال 
صحة بيانات ele‏ ال مواطنة (Citizen Science)‏ والتعهيد الجماعيء وحذروا من جهل 
وعدم مقدرة الحشود على التنبؤ ومخاطر التفاوت (فيما يتعلق بالتغطية)ء والمتغيرات 
(فيما يتعلق بالجودة والتجانس)ء وتوليد البيانات المتحيزة المتأصلة في مشروعات المساواة 
الكبرىء التي تفتقر إلى القادة وتتشكل من مجموعة ضيقة من السكان ذوي التباين في 
المهارات والدوافع )2007 .(Carr‏ وق الواقع» فإن وسائل التواصل الاجتماعي يهيمن عليها 
نخب رقمية غير ممثلة )2009 (Crutcher and Zook‏ في حين أن هناك مجموعات كبيرة 
من المجتمع مثل الفقراء وكبار السن لا ينخرطون في وسائل التواصل الاجتماعي أو يفتقرون 
إلى الهواتف ASII‏ ومن ثم فإن أي بيانات يتم جمعها لا تعكس بالضرورة وجهات نظر 
هؤلاء الأشخاص أو أحيائهم )2013 (Crawford‏ ومن ثم فمن الضروري للغاية أن يتم 
تحديد ووضع مثل هذه التحيزات à‏ الاعتبار وذلك ,عند تحليل البيانات من أجل كسب 
فهم أكثر شمولية للظاهرة: Lom.‏ إذا ما كان سيتم استخدام مثل هذه البيانات في أعمال 
السياسة العامة والقرارات التي تؤثر على حياة الناس كالنتائج الصحية. 


وعلاوة على «US‏ يوجد بعض المخاوف بشأن جودة وتجانس المحتوى والبيانات الوصفية 
التي تم تكوينها عبر أفراد متنوعي المهارات والدوافع» ومخاوف بشأن LAS‏ توفير درجات 
موتقة من الاعتمادية وتكوين إحساس بالمصداقية )2013 .(Dodge and Kitchin‏ وقد 
gol‏ هذا بالبعض إلى افتراض أن عمل التعهيد الجماعي "الهواة" سيكون إجراؤه بشكل 
أفضل إذا بذل على تصحيح وتنويع البيانات ولیس على تكوين البيانات )2007 (Carr‏ 
فالمثال الذي ألقى Carr‏ الضوء عليه هو موسوعة ويكبيدياء إذ على الرغم من كونها 
شهيرة وشاملة: إلا أنها تتوسع بشكل غير مدروس ماثل الاهتمامات ال مختارة للمشاركينء 
ويوجد بها مقالات غير كاملة وأحيانا مكتوبة بلغة ركيكة وتافهة ومطعون ني صحتها بشكل 
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كبيرء مما يبقوض zumo‏ وإمكانية استخدامها أو نفعها. وادعى Carr‏ أنه " إذا كانت 
موسوعة ويكبيديا غير مجانيةء فمن غير ا محتمل أن قراءها سيكونون أكثر تسامحا تجاه 
تلك "ogl‏ )2007:4(. ويمكن أن bs‏ خريطه الطريق ال مفتوح (OpenStreetMap)‏ 
cs‏ التغطية في بعض الأماكن حيث يوجد عدد قليل من المتطوعين. ويوجد أيضا بعض 
المخاوف بشأن استدامة أعمال التعهيد الجماعي التطوعية» حيث ادعى 2007 Carr‏ أن 
الارتباطات التي تربط مجموعة افتراضية من الناس سويا bole‏ ما تكون ارتباطات andas‏ 
وهي تفتقر إلى العمق والالتزام الإجباريء وعادة ما تكون عرضة للتشتت» وهي تعتمد 
بشكل كبير على مجموعة أساسية صغيرة لكي تحافظ على سير المشروع وتوفر الجزء الأكبر 
من العمل. وعلى النقيض من eUS‏ لاحظ البعض أنه فيما يتعلق ب OpenStreetMap‏ 
فإن جودة البيانات المقدمة تطابق جودة البيانات التى تقدمها الشركات الاحترافية وآن 
التغطبة متنوعة )2011 .(Haklay 2010, Mooney at al‏ 

odas‏ المناقشة تلقي الضوء على أن 55$ مجموعة البيانات كبيرة للغاية من ناحية 
الحجم» فإن هذا لا يعني بالضرورة أنها عشوائية أو ممثلة للضاهرة أو صحيحة أو ذات 
مصداقية أو موثوقة. وكما لاحظ )2012( :boyd and Crawford‏ "کون السانات الكيرة 
تزودنا بكميات هائلة من البيانات» فإن هذا لا يعني أن القضايا المنهجية مم تعد ذات 
صلة. ففهم العينة على سبيل «JULI‏ يعد أكثر أهمية الآن عما كان عليه الأمر في الماضي" 
(ص 668(. وبالنسبة ل )615 :2009( Kelling et al.‏ فإن هذه القضة تعتير قضية Lol‏ 
Las‏ أي "المعلومات المتعلقة بأصل وتعريف وملكية وبنية" مجموعة البيانات التي تمكن 
محللي هذه البيانات من معرفة LAS‏ تكوين هذه البيانات ومعالجتهاء وتمكنهم كذلك 
من تقييم جودة وصحة البيانات. وعلى الرغم من «US‏ فإن مصدر معظم مجموعات 
بيانات البيانات الكبيرة مقيد بهؤلاء الذين قاموا بإنشاء البيانات: مما يجعل من الصعوبة 
مكان تقييم صحة الدراسات المنشورة التي اعتمدت على هذه البيانات. فأحد التحديات 
الرئيسية التي تواجه البيانات الكبيرة يتمثل في المقدرة على معرفة تفاصيل سلالة الأصل 
والذي يشمل تقييمات مستويات الأخطاء والشكوك في مجموعة البيانات» وإنشاء وسائل 
فعالة للتحقق من وتنظيف ومعايرة البيانات عالية السرعة وشديدة التنوع. 
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:(Data Integration and tpe دمج وتوافقية البيانات‎ 


إن أحد الوعود التي انبثقت عن ثورة البيانات ES‏ إنشاء مجموعات انات ذات ترارط 
قوى مما يمكن هذه NAT‏ فنأ bis Jen‏ ف Je‏ إنشاء قيم ومعارف إضافية. 

وكما اتضح من خلال تطور البنى التحتية للبيانات ومدمجي البيانات» OB‏ العديد من 
SLIL‏ عرضة لي تندمج مع بعضهاء واتضح أيضا أن الكثير من البيانات تظل منعزلة 
فى مستودعات أو يمكن دمجها فقط من خلال معالجة إضافية كبيرة. ومن أجل أن يتم 
دمج البيانات في مجموعات بيانات جديدة: أو استخدام هذه البيانات بالاشتراك مع أي 
بيانات أخرىء فإن هذه البيانات تتطلب حقول تأشيريه مشتركة وتوفر معايير البيانات» 
وبيانات وصفية متسقةء وتوافق على مستوى التنظيم والصيغة. وف حين أن تقدما كبيرا 
قد حدث ف إدارة البيانات وتطبيق معايرر البيانات التي قادتها منظمات مثل المنظمة 
الدولية (ISO) yole‏ وزابطة الشبكة العالمية (W3C)‏ واتحاد اللعلومات المكانية 
المفتوحة (OGC)‏ في سبيل المحاذاة بين البيانات والبيانات الوصفية وتحسين التوافق بين 
ا منصات التقنية المختلفة التي تعالج البيانات وتحتفظ بهاء وتطوير البيانات المترابطة. 
إلا أن الكثير من مجموعات البيانات لا هكن ربط بعضها ببعض. فهي تشكل ما أطلق 
عليه )2012( Singh‏ مصطلح "السانات الجانحة" .(Stranded Data)‏ 

إن معظم دراسات البيانات الصغيرة لا تز تزال S‏ تنشئ Ollo‏ جانحة كونها تستخدم لغات 
توصيف خاصة بها وأنظمة تنظيم البيانات التي تناسب الأغراض التي سيستخدمونها فيها. 
ولكن القليل من هذه الدراسات تضع في اعتبارها قضايا التوسع والربط. وهذه هي أيضا 
الحال غالبا داخل ال منظمات التي يوجد بها إدارات منفصله تستخدم أنظمتها الإدارية 
والتصنيفية الخاصة. فعلى سبيل «JUL‏ فإن JS‏ واحدة من هيئات التخطيط التي يبلغ 
عددها تمان وثمانين هيئة في إيرلندا تستخدم نظامها الخاص لاستخدام الأراضي وتصنيف 
المناطقء وعلاوة على ذلك. فهذه الهيئات توظف العديد من ال منصات التقنيه ال مختلفه 
لغرض إدارة وتخزين وتخطيط البيانات» فربط جميع هذه البيانات وتوحيدها قي نظام 
وطني واحد ليس dago‏ سهلة على الإطلاق. وباممثلء فإن توسيع مجموعات البيانات 
الوطنية سوف يواجه مشاكل مماثلة. فعلى سبيل «JULI‏ فإن ربط الإحصائيات السكانية 
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في إيرلندا وإيرلندا 21 ol so bear ds‏ الام sex 321g as denso‏ 8,5 اليل 
بفرض عددا من التحديات الفنية وذلك يرجع إلى أن <۳١‏ من الأسئلة متطابقة, 0$ 4Y‏ 
أخرى من الأسئلة ممكن أن يتم مضاهاتها وذلك من خلال تقسيم خطط التصنيف وإعادة 
تجميعها في الخطط المشتركة. وحتى إذا تم هذاء فإن البيانات ستكون ذات جغرافيات 
إحصائية ضمنية مختلفة يتم تجميعها في وحدات مختلفة الأحجام )2007 (Kitchin et al‏ 
وتتضاعف هذه القضايا عبر قارة أوروباء حيث تتبع كل دولة وكل مؤسسة إجراءات 

مختلفه (وحدات وتصنيفات)ء وتعتمد فترات زمنيه متفاوته (عدد ال مرات التي يتم فيها إنشاء 
البيانات)» وتستند إلى أماكن متباعدة (الجغرافيا الإحصائية)» وتستعمل تقنيات مختلفة 
(الصيغ). ومن ثم فلقد استنتج )118 :2012( Rubert‏ أنه حتى مع وجود بيانات حكومية 
شاملة. إلا أنها في غالب الأحيان تتصارع تحت وطأة الأعداد التي لا تحصى من مجموعات 
coL UI‏ المتضاربة وغير المتوافقة وغير الصالحة للمقارنة: وتسعى بعض اللبادرات Jis‏ 
توجيهات إنسبير (INSPIRE)‏ (البنية التحتية للمعلومات المكانية في اطمجتمع الأوروبي) 
إلى تكوين cU‏ مشتركة عير الجغرافيا الآوروبية الإاحصاشية المشتركةء ولكن الوصول إلى 
توافق في هذا الشأن يعتبر عملية بطيئة وذلك يرجع إلى أن جميع الولايات لا ترغب 
في الانتقال بشكل أحادي (أي من طرف واحد) إلى نظام جديد للبيانات وخلال العملية 
يوقفون سجلاتهم الزمنية ويفقدون مقدرتهم على إجراء تحليلات زمنية متتاليةء إضافة 
إلى أن كل ولاية لها أولويات مختلفة فيما يتعلق بالبيانات التي ترغب في إنشائها وتتبعها. 
وتوجد هذه التحديات نفسها فيما يتعلق بالبيانات الكبيرةء والتي رها تكون غير 

متجانسة وغير منظمة بشكل كبير للغايةء ومتفاوتة فيما يتعلق بالجودةء وهي أيضا مرنة 
وقابله للتوسع. فربط وتجميع مثل هذه البيانات ليس مهمه Alas‏ على الإطلاق وهي 
تتطلب تطوير مجموعة جديدة من الأدوات والأساليب» وكذلك إنشاء وتبني معايير جديدة 
للبيانات. فأحد الحلول «à s hhl‏ والذي أشار إليه )2011( Short et al‏ هو دمج البيانات 
المخصص والذي يمكن المستخدمين من التحكم بسرعة وبشكل مباشر في أي من البيانات 
التى سيتم دمجهاء وذلك على الرغم من أن هذا يتطلب أن تكون مجموعة البيانات تتمتع 
بسمات معينة مثل البنية التحتية الدلالية المؤثرة. إن ربط وتجميع مثل هذه البيانات 
alos el sc‏ يؤدي إلى sl‏ المتقاطع (Cross-Contamination)‏ بسبب البيانات 
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ذات الجودة الضعيفة والحالة المتهالكة مما يؤدي إلى فساد وتلويث مجموعات البيانات 
الفعالة ويحولها إلى مجموعات بيانات ضعيفة. ومع ازدياد طوفان البيانات» فإن إيجاد 
الحلول التى تساعد على دمج البيانات وتوحيدها وتحافظ على سلامتها وفعاليتها سيمثل 
قضية ملحة» وذلك على الرغم من أن عدم المقدرة على ربط البيانات له جوانب إيجابية 
أيضا وذلك فيما يتعلق بتقبيذ مراقبة البيانات وتحسين أمن البيانات (انظر الفصل العاش). 
التحليل الركىك وال مغالطات ال :(Poor Analysis and Ecological Fallacies)‏ 


جميع النتائج التي يتم التوصل إليها من الدراسات تكون دقيقة وسليمة وقوية بحسب 
البيانات التي تم استخدامها والتحليلات التي أجريّتء وإذا ما وضعنا جودة وصحة البيانات 
dale‏ فخلال تصميم أي بحث يكون من المهم للغاية استخدام منهجية ملائمة وآليات 
مناسبة. فالإخفاق في فعل ذلك سيؤدي إلى مغالطات بيئية خطيرة عند تفسير gill‏ 
معنى استخلاض النتائج المضللة والتي في الواقع لا تدغمها البيانات المستخدمة. وهناك 
تاريخ طويل من ال مساجلات التي تتعلق بمكامن القوة والضعف النسبية في العديد من 
الأنماط والأساليب المنهجية المختلفةء والظروف التي يمكن فيها تطبيق مثل هذه الأنماط 
والأساليب بشكل صحيح. وعلى وجه العموم: هناك الآن إرشادات وقواعد محددة بشكل 
واضح تتعلق بكيفية تكوين وتحليل أنواع مختلفة من البيانات عبر أنظمة متعددة. وعلى 
الرغم من US‏ وفيما يتعلق بالبيانات الكبيرة» فإن esle‏ البيانات لا تزال في أطوارها 
التمهيدية. ومثل هذه المعايير لا تزال في طور التشكيل والصياغة. فآليات جديدة يتم الآن 
اختراعهاء وتوسيعهاء وتقييمها. 

وهناك أربع قضايا منهجية تتعلق بالبيانات الكبيرة جذبت الانتباه» فأولى هذه القضايا 
تتمثل في الإجابات المتفاوتة بشكل عميق والتي تؤدي إليها الافتراضات والمقاربات داخل 
النماذج )2012 (Silver‏ وثانياء مدى قدرة الآليات والأساليب المستخدمة على إحداث 
الاستسقاطء أي رؤية واستخلاص أنماط من البيانات العشوائية التي لا معنى لهاء أو إحداث 
فرط التعلم أو املاءمة (Overfitting)‏ والتی تحدث hus‏ يصف نموذج إحصالي P‏ 
Glas e‏ أو ضحجيحًا yas‏ من العلاقة الكامنة )2012 (boyd and Crawford‏ أو الخطأ 
في التعامل مع التشويش على أنه معلومات )2013 .(Silver 2012; Siegel‏ وثالث هذه 
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القضايا يتمثل في الاتهامات ob‏ بعض الآليات المعينة تؤدي إلى ما هو أكثر بقليل من 
تحريف السانات )2011 daddy .(Data Dredging) (Webster‏ اذا كان بإمكان SUMI‏ 
أن تتوسع خارج نطاق بيانات ضبط الاختبار إلى مليارات السجلات المتدفقة في العام 
الواقعي )2008 (Bryant et al,‏ 


إن النماذج تهدف إلى توضيح والتعبير عن العلاقة بين المتغيرات وكيفية عمل النظام. 
فكل نموذج يتم تأسيسه على نظرية «duse‏ وبناؤه باستخدام مجموعة من الافتراضات 
والمقاربات التي تبين كيفية تفاعل المتغيرات» في حين أنه يتم اختبار صحة النموذج من 
خلال البحوث التجريبية. فإذا كانت النظرية والافتراضات غير صحيحة. فإن جميع التنبؤات 
ستكون غير صحيحة فى هذه الحالة CUIS‏ وحتى التغييرات الصغيرة للغاية على الافتراضات 
في نموذج هكن ما أن تؤدي إلى نتائج مختلفة تماما. ففى حالة الأزمة المالية العالمية التى 
حدثت ف العام 2008 ادعى )2012 (Silver‏ أن أحد العوامل المهمة للغاية في إحداث 
مثل هذه الأزمة كان استخدام نماذج تمويل دمجت المخاطر بحيث يمكن حساب احتمالية 
الدخل المحتمل مع الارتياب لآن المخاطر المحتملة من الصحعب تقييمها. ونتيجة SUU‏ 
اعتمدت النماذج على افتراضات غير يقينية ولكن تم معاملتها كما لو كانت مخاطر معروفة 
على وجه اليقين. والنتيجة كانت افتراض أن السندات IU‏ الجديدة التي يحيط بها 
ارتياب نظامي عال للغاية هى أصول ذات مخاطر منخفضة: وهذا افتراض ثبت أنه خاطئ. 
às‏ الأنظمة adis‏ فان Jis‏ هذه الأخطاء لا يتم A PESE‏ ذرجات ولكن يتم 
قياسها على أساس ترتيبها حسب الأهمية. وقد قدرت مؤسسات ستاندرد أند بورز 333929 
(S&P and Moody's)‏ مخاطر التخلف عن الدفع alus, ls‏ بالتزامات الديون المضمونة 
(CDOs)‏ بأقل من قيمتها بعامل من مائتين )45 :2012 .(Silver‏ وبغض النظر عن جودة 
البيانات الضمنية: فإذا كان النموذج خاطئاء فأي نتائج يتم استخلاصها من هذا النموذج 
ستكون خاطئة كذلك. 

لقد افترض )2013( Granville (2013) and Taleb‏ أن لعنة أو مأساة السانات الكيرة 
مُضاعفة. نتيجة العلاقات الإيجابية الخاطئة بين البيانات؛ وأنماط مجموعات البيانات التى 
تكون عرضية بشكل تام» وليس لها أي قوى تنبؤية: ولا يمكن تكرارهاء ورها يمكن أن 
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تكون قناعا لنماذج أضعف ذات canal‏ فمجموعات البيانات تشتمل غالبا على البيانات 
التي يبدو أنها مرتبطة بعضها البعضء حتى ولو كانت العلاقة بينها عشوائية في الواقع. 
ومع زيادة حجم مجموعة البيانات» تتضاعف الأخطاء الإيجابيةء إلى الحد الذى تكون فيه 
أي علاقة تقريبا بين البيانات مهمة من الناحية الإحصائية وفق معايير اختبارات الارتباط 
التقليدية )2013 .(Pentland 2012: Rajaraman et al. 2012; Taleb‏ وعلى النحو «l3‏ 
ففي أساليب التنقيب عن البيانات» مثل شجرة القرارات (تسلسل اتخاذ القرار)» يمكن أن 
يتسم النموذج بفرط الملاءمة ي يتم استنباط نتائج استثنائية تحول إلى نتائج قابلة للتعميم 
مما يؤدي هذا إلى حدوث مغالطات بيئية. فالبيانات الكبيرة في هذه الحالة لا تعنى معرفة 
أفضلء ولكنها تعني بالأحرى ارتباكا أكثر وذلك من جراء صعوبة تحديد دالة حقيقية وسط 
ركام من الدلالات. ولذا فإنه: bli"‏ يكون الأقل هو الأقوى تأثيرا" Verhulst)‏ تم الاقتباس 
من 2012:14 (Bollier‏ 


إن أحد الجوانب المهمة في مشكلة الأخطاء الإيجابية ليس حجم مجموعة البيانات 
فحسب» بل كيفية معالجة وتحليل مجموعة البيانات هذه. فأحد أجزاء إستراتيجية الكثير 
من تحليلات البيانات الكبيرة يتمشل ق فحص مجموعة البيانات قبل صياغة الافتراضات 
(انظر الفصل السادس). ومن الطرق المتبعة للقيام بهذا الأمر حساب الارتباطات بين 
جميع المتغيرات Wig‏ من أجل تحديد العلاقات المحتملة بين البيانات الجديرة بالدراسة 
الإضافية. وتشكل هذه العملية ما يعرف بتجريف البيانات (Data Dredging)‏ والتى 
تسمى أحيانا تصيد البيانات» وهي ممارسة لا يحبذها بشدة الكثير من الخبراء الإحصائيين 
.(Webster 2011; Piatetsky-Shapiro 2012)‏ فال مش كله التي ترتبط بهذا ال منحى 
مشكلة مزدوجة. فمن جهه» هی تحدد آلاف الأخطاء الايجابية ال محتملة وذلك دون 
تحديد أي من هذه الأخطاء عشواني (slo‏ منها ذو مغزى. ومن جهة أخرىء هكن أن تؤدي 
إلى التنقل من متجر لآخر طلبا للأرخض وعرض النتائج التي تؤكد اعتقاد diabl‏ مع وجود 
دليل من التحليل ا مستخدم من أجل أن يجعل الادعاء يبدو Webster) Lasso Vois‏ 
Taleb 2013‏ ;2011(. فالسؤال الشاتك الذي يطرح نفسه هناء كما أشار Granville)‏ 
2013( هو كيف مكن التمييز بين دالة حقيقية ودالة عرضية وسط الكميات الهائلة من 
البيانات؟ وكيف هكن ألا ينقاد المرء للاستسقاط وفرط التعلم؟ 
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إن هناك بعض الحلول الممكنة. حيث اقترح )2015( Rajaraman et al.‏ استخدام 
مبدأ بونفیرونی (Bonferroni)‏ والذي يسعى إلى تحديد الأحداث النادرة جدا لدرجة أنها 
لا يمكن أن تحدث ف البيانات العشوائية. وذلك من أجل فرز الارتباطات الفعلية عن 
الارتىاطات العشواشة. كما كان )2013( Lusk‏ من أنصار استخدام مستويات dy juo‏ 
معززة. وذكر نقطه انطلاق معيار duas‏ سيجما (Five Sigma)‏ ا مستخدم حالا في الفيزياء 
من أجل مواجهة الارتباطات الوهمية وإعلان الاكتشافات (احتمال كون النتائج خاطئة 
وناتجة عن التغيرات الإحصائية فقط هو واحد ف كل ثلاثة ملايين وخمسمئة ألف 9l‏ 
٠‏ .). ومن الحلول المطروحة 5,2( هو التحقق الإضافي من خلال مجموعات 
بيانات أخرىء أو التقسيم العشوان للجموعة البيانات الحالية إلى عينات ومعرفة إذا ما 
كانت العلاقة أو PERRE Haw bY‏ عبر العينات )2000 .(Jensen‏ وفيما يتعلق 
بفرط التعلم» ناقش )2010( Miller‏ إستراتيجية استخدام الخلفية المعرفية: والتى تتكون 
من استخدام الحقائق المعروفة عن مجموعة بيانات مستقاة من الافتراضات عن النظام 
والحقائق الملاحظة: ومعرفة الخبير, أو النظرية: أو المقاييس الممتعة والمرغوب فيها التي 
تقيم البساطة والتيقن والفائدة والحداثة DEU‏ المستحدثة. وذلك من أجل فصل الأنماط 
الهادفة عن التشويش. وعلى الرغم من «US‏ فمن الواضح أن هناك حاجة لبذل أعمال 
إضافية من أجل تطوير أساليب لتقييم المغزى والدلالة. في عصر البيانات الكبيرة. 

وإذا وضعنا ف الاعتبار أن تحليلات البيانات لا تزال في مراحلها الأولى من التطور, وتم 
تطبيقها بالدرجة الأولى على بيانات الضبط والاختبارء يظل أيضا هناك بعض المخاوف 
بشأن فعالية مثل هذه الأساليب في مجاراة البيانات الفوضوية وغير المنضبطة. وكما أشار 
Byrant et al. (2008: 4)‏ فإن "الكثير من الخوارزميات لا تتوسع خارج نطاق مجموعات 
البيانات التي تتكون من بضعة ملايين من العناصرء أو لا يمكنها أن تتحمل التشويش 
والثغرات الإحصائية الموجودة في بيانات العام الواقعي". فإذا كان هناك آي اختلالات أو 
تحيزات موجودة في الخوارزميات» فمن شأنها أن تؤدي إلى انحراف النتائج وتفسيرات هذه 
النتائج )2012 .(byoed and Crawford‏ ويرتبط بهذا التخوف أيضا القلق من أن هناك 
اعتمادا E‏ والكثير جدا من الموثوقية ال موضوعة في الخوارزميات وذلك من أجل إجراء 
التحليلات» واستخراج المنافع والمزايا التي تجلبها الخبرات وا معارف والفطرة البشرية من 
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أجل فهم ظاهرة ما )2012 (Lohr‏ ومن ثم هناك حاجة لإجراء المزيد من العمل من 
أجل تأسيس وتقييم صحة التحليلات الجديدة والثقة في النتائج التي يمكن استخلاصها من 
هذه التحليلات. 

ومن الانتقادات الأخرى الموجهة إلى تحليلات البيانات الكييرة هو تركيز هذه البيانات 
على الانية (هنا (ola‏ وذلك بالنظر إلى حداثتهاء وعلى وجه العموم» فإن البيانات الكبيرة 
تفتقر إلى العمق التاريخي. فشبكات الاستشعار الجديدة أو بيانات التعهيد الجماعي يمكن 
أن توفر بيانات مستمرة وثرية» ولكنها تتسم بقصر الفترات الزمنية التي تغطيها. ونتيجة 
لذلك» فإن الكثير من التحليلات تكون مناسبة في وقتها ولكنها تفتقر إلى العمق الزمني 
وهذا أمر Y‏ غبار عليه ومستحسن إذا كان الشخص مهتما بالوقت الحاضر بتتبع حدث 
ممتد باستخدام وسائل التواصل الاجتماعي (على سبيل المثال حدث سياسي كبير مثل الربيع 
العربي)؛ أو أن يكون الشخص UB‏ بتحليل عملية مادية لا تتغير مرور الوقت (مثل تجربة 
(iL S‏ ولكن سبكون الآمر ا للمشاكل إذاتم استخدامه من أجل فهم العمليات 
التي azz‏ لآلاف السنين أو أكثر (على سبيل JULI‏ الأنظمة البيئية والجيولوجية). وينطبق 
هذا الانتقاد أيضاء بالطبع» على دراسات البيانات الصغيرةء والتي تعتبر Là‏ لقطات تم 
اتخاذها في أماكن معينة وأوقات محددة. 


المهارات والموارد البشرية :(Skills and Human Resourcing)‏ 
في حين أن بعض تحليلات البيانات يتم تركها للخوارزميات» وخاصة العمل المتعمق 
للمعالجة والحسابات. إلا أن أعمال التوجيه والتفسير لا تزال إلى حد كبير حكرا على المحليين 
البشر. فبالاعتماد على مهاراتهم وخبراتهم ومعارفهم» يتخذ الباحثون والمحللون القرارات 
المتعلقة بالأماكن المثلى التي ينبغى التركيز عليهاء وكيفية صياغة وإجراء التحاليلء وإدراك 
المراد من النتائج والعمل على هذه النتائج. فالبشر يظلون هم الفاعلين الأساسيين في تأسيس 
وتشغيل والمحافظة على المشروعات التي تقودها البيانات» فعلى سبيل «JUL‏ يتطلب تأسيس 

بنية تحتية للبيانات مهندسي برامج وأجهزة ومسئولين رقميين: وأخصائيين في السياسة وخبراء 
محالات علميه ومحللين. فهؤلاء العاملون يضمنون Ie bud‏ للنظام د ينتج بيانات 
مفيدة وصحيحة 4353529 ويوفرون الوسائل الضرورية لتخزين ومشاركة البيانات» ويؤمنون 
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مجموعة من الأدوات التحليلية والإدارية المناسبة» التي يمكنها استخلاص القيمة وا معرفة. 
وهم يعرفون أيضا ماهية الأسئلة التي ينبغي توجيهها وما الذي يتعين فعله بالإجابات على تلك 
الأسئلة. ولذاء فإن المواهب البشرية بضاعة رائجة. ولكن وكما أشارت بعض التقاريرء هناك 
نقص متزايد في الموظفين الذين يتمتعون بمهارات في البيانات وخاصة محللي ومديري البيانات 
الذين بإمكانهم تحويل البيانات وال معلومات إلى معارف وعلوم );2011 Gantz and Reinsel‏ 
.(Manyika et al. 2011; Shah et al. 2012; Rooney 2‏ 


وقد أكد )2012:3( Manyika et al.‏ " أن الولايات المتحدة وحدها تعاني نقصًا يبلغ 
٠‏ إلى ۱۹٠,٠٠١‏ شخص بتمتعون مهارات تحليلية diazio‏ وكذلك 1,0 مليون مدير 
ومحلل من أجل تحليل البيانات الكبيرة واتخاذ القرارات بناء على اكتشافاتهم". واستطردوا 
بالإشارة إلى أن مثل هذه المواهب "من الصعب إيجادها إذ تستغرق سنوات عديدة في 
التدريب آو إعادة التدريب" (ص .)٠١‏ وقيم )2012( Shah etal.‏ عدد ***0 موظف في 
اثنتي عشرة شركة dalle‏ فيما يتعلق بمقدرتهم على معالجة تحليلات البيانات بشكل مثمر 
حيث قاموا mas‏ الموظفين في ثلاث مجموعات. الأولى. التجريبيون غير المعترضين الذين 
يثقون في التحليلات أكثر من الأحكام الشخصية (XEF)‏ والثانيةء متخذو القرار المتعمقون 
الذين يتجاهلون التحليلات ويتصرفون ما يليه عليه حدسهم الفطري (X413)‏ والثالثه» 
المتشككون المطلعون (FA)‏ الذين يوازنون بين الأحكام الشخصية والتحليلات. ويسعون 
إلى تفسير البيانات ووضعها في سياقها ال مناسب عند اتخاذ القرارات. وبشكل مقلقء فإن 
اولتك الذين يدعون البيانات تعبر عن نفسها واولئك الذين يتجاهلون البيانات والتحليلات 
بشكل روتيني يفوقون في عددهم أولئك القادرين بشكل أفضل على فهم البيانات الكبيرة. 
وعلاوة على ذلك لاحظوا أن الشركات تعاني من أربعة مشاكل تحول دون الاستفادة من 
إمكانيات البيانات الكبيرة وهي: 
Yol e‏ أن المهارات التحليليةه تتركز à‏ عدد محدود للغاية من الموظفين ولا تنتشر à‏ باقى 
الموظفين. 
« ثانيا: أن حلول تقنية المعلومات تتركز بشكل تقليدي على التقنية وبشكل أقل بكثير على 
المعلومات في حين أن المعلومات هي المجال الذي يتم من خلاله جني القيمة. 
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.36 أن تخزين البيانات يحدث كيفما اتفق ومن الصعوبة بمكان على أي موظف أن 
يحدد مكان امادة ]15 مم يكن هذا الموظف هو ال مسئول عن جمعها. 

ه رابعا: أن المديرين يفهمون قيمة الموهبة ورأس JULI‏ والعلامة التجاريةء ولكن Y‏ يفهمون 
قيمة المعلومات» ولا يبذلون جهودا كافية من أجل فهم البيانات أو ترتيب هذه 
LUI‏ بشكل فعال وكفاء. 

ويوجد مثل هذا النقص ف المهارات أيضا في المؤسسات الأكادهية» حيث إن خبراء 
المجالات المختلفة تدربوا في وقت ندرة البيانات وهم غير مستعدين بشكل كبير لعصر 
البنى التحتية للبيانات والبيانات الكبيرة وذلك باستثناء عدد لا يتجاوز أصابع اليد الواحدة 

SSI Ala من العلماء‎ 

إن القلق الذي ينتاب الكثير من المعلقين هو أن المنافع المحتملة من الشركات والعلوم 
التي تقودها البيانات لن يتم تخقيقها بشكل كامل بسبب نقص المواهب البشرية وخاصة 
علماء البيانات الذين تجتمع لديهم مهارات مبرمجي البرامج والإحصائيين والرواة المحترفين 

وذلك من أجل استخلاص شذرات الذهب المختبئة تحت جبال من البيانات Cukier)‏ 

2010( واكديرين الذين تفهمون كفة ل od‏ القتذرات ال قرازات حخكمة. sy‏ 

يتعلق بالمديرينء وكما أشار )23 :2012( Shah et al.‏ فإن "الاستثمار في التحليلات يمكن 

أن يكون بلا جدوىء ويمكن حتى أن يكون ضاراء إلا إذا كان بإمكان الموظفين دمج هذه 
البيانات ف العملية المعقدة لاتخاذ القرارات". فالجامعات بدأت الآن في إنشاء برامج 
جديدة ومراكز بحثية لعلوم البيانات» ويسعون إلى تعديل الدورات التدريبية الحالية لي 
تشتمل على التدريب على مجموعة امهارات الجديدة هذه وذلك في مسعى إلى تنقيح 
بعض الثغرات المتعلقة بالمهارات. ويتم تنظيم بعض هذه البرامج بالمشاركة مع بعض 
الشركات. فعلى سبيل مثالء colo‏ شركة آي بي (IBM) e!‏ بالفعل في العمل مع العديد من 
الجامعات من أجل تطوير دورات ومقررات تعليميةء وهناك بعض الشركات الأخرى مثل 

شركة تيراداتا (Teradata)‏ التي تقدم برامج dus jJ‏ معتمدة من الجامعات Bertolucci)‏ 

2013( وذلك على الرغم من أن هذه البرامج من الممكن أن تؤدي إلى مخاطرة توجيه 

الطلاب تجاه رؤى وبرامج خاصة ببعض الشركات. 
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الحدول رقم (4-5) 


الخبرات اللازمة Te" eU J‏ التحتية للسانات وإجراء بحوث السانات SJ!‏ 


خيرات اب محال 


Domain Expertise 


خيرات السانات 


Data Expertise 


الخبرات التحلبلىة 
Analytical Expertise‏ 


e‏ معرفة نظرية وعملية عميقة بالمجال (المجالات) ذات الصلة. 

o‏ المعرفة التامة بأنواع البيانات التي ستتم دراستها وأصل هذه البيانات 
وأهميتها للمجال (المجالات) ذات الصلة. 

o‏ المقدرة على تحديد الفجوات المعرفية. 

e‏ المعرفة التامة بالأدبيات والاتفاقيات النظامية. 

o‏ المقدرة على تعليم الآخرين الذين ملكون خلفيات متعددة من أجل 
استبعاب كل ما ذكر „Mel‏ 

٠‏ فهم كيف يتم تجميع البيانات والمحافظة عليهاء وكذلك فهم العلاقات 
بين الأشياء المادية والتمثيل الرقمي لهذه الأشياء (إذا كان ذلك ممكنا). 

٠‏ المعرفة التامة بنماذج البيانات و/ أو اتفاقيات وصف البيانات. 

ه فهم كيف يتم الوصول إلى البيانات ذات الصلة وتخزين هذه البيانات. 

« المقدرة على تسهيل مشاركة البيانات وتصحيح الأخطاء بشكل $942« 
سواء كان هذا أثناء el‏ بعد ال مشروع. 

e‏ المقدرة على SJ!‏ بالاستخدامات المستقبلية أو البديلة للسانات. 

٠‏ فهم الأشكال الجديدة من ال مطبوعات التي يمكنها أن تحتوي على البيانات. 


ه فهم نقاط القوة والضعف في أدوات البحث الفردية. 

e‏ اختيار وتعديل الأدوات المناسبة لدعم الأهداف البحثية. 

e‏ التنبؤ بالمشاكل التي يمكنها أن تنشأ مع استخدام الأدوات ا مختارة 
لتنفيذ مهام المشروع. 


٠‏ توقع واكتشاف معدلات الأخطاء في خوارزميات البيانات وتحليلات 
البيانات» واختيار الطرق الإحصائية التي تفسر هذه الأخطاء كلما كان 
ذلك Las‏ 

٠‏ تعليم الآخرين كيفية تفسير نتائج البحث. 
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القضايا الفنية والتنظيمية 


o‏ المقدرة على تحديد الأهداف ال مناسبة واطواعيد النهائية وتنسيق 
مسارات العمل امتوازية إذا كان ذلك ضروريا. 


خيرات إدارة امشاريع 


Project Management 


expertise 


o‏ المقدرة على اختيار أفضل الإستراتيجيات المناسبة للاتصال والتوثيق 


للمشروع. 
o‏ إجادة الأدوات البحشة التعاونية. 
0 الإرادة القورة للعمل من أجل تحقيق النتائج التي A425‏ جميع أعضاء 





. Williford and Henry (2012: 16 - 20) امصدر: مقس من‎ 


إن عتم البيانات ليس هو الخبرة الوحيدة التي يتعين تأسيسها. وبحسب ما ادعى 
Olè Williford and Henry (2012)‏ تأسيس بنى تحتية للسانات وإجراء البحوث على 
البيانات الكبيرة يتطلبان دمج أربعة أنواع من الخبرات من أجل تحقيق النجاح (انظر 
الجدول .)4-١‏ وهذه الخبرات الأربعة كما ادعى )2013( Rubert‏ يمكن أن يتم تحقيقها 
فقط من خلال منهج متعدد التخصصات والقطاعات. مما يسمح بتوحيد المهارات والرؤى 
التي يمكنها أن تتقاطع مع المجالات وتحقق التعاون بين المؤسسات الأكاديمية والصناعية 
والحكومية. وحتى b‏ مثل هذا الوقت» أي عندما يتطور وينضج جيل جديد من المواهب 
امناسبة. وتتطور مناهج متعددة المجالات والأآنظمة: فإن المشروعات ستظل عرضة للإخفاق 
أو سوء الأداء. 


الخاتمة: 

كشف هذا الفصل عن أوجه النقص الفنية ف البيانات الصغيرة المتوسعة والبيانات 
الكبيرة. وناقش أن البيانات الكبيرة تحيط بها العديد من القضايا التي تحول دون الاستفادة 
منها وتطويرها في الوقت «2l JI‏ ومن هذه القضايا على سبيل الذكر لا الحصر النطاق 
الضيق إلى حد ما لمجموعات البيانات المتوافرة. والوصول المحدود إلى البيانات» والجودة 
الضعيفة للبيانات» وصحة وموثوقية البيانات» وسلالة أصل البيانات المحددة بشكل due‏ 
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الفصل التاسع 


والشادلية الضعيفة: والتحليلات المشكوك as‏ والمغالطات cdi‏ وقاعدة المهارات المطورة 
بشكل ضعيفء والاستجابة المؤسسية. وقد gol‏ ذلك ب )2012( Dembosky et al.‏ 
للادعاء Ob‏ "التحركات الأولية رما تكون واعدة بشكل مفرط ولكن أداءها رما يكون » 

من المتوقع" loas.‏ عندما يصبح هؤلاء الذين يتبنون حلول البيانات الكبيرة "متخمين 
بسبب التقنية التي لا تزال حديثة للغاية وغير مُنقحة. فالتقنية أضحت مرهقة ومثبطة 
أكثر من كونها مفيدة". وبمرور الوقت» فإن الكثير من هذه القضايا سيتم التعامل معها إلى 
حد ما وذلك من خلال الحلول الإدارية والفنية؛ ولكن ستظل هذه القضايا تشكل مخاوف 
وتتطلب اهتماما Lol Mass Lia‏ متحددا. وينطبق الأمر ذاته أيضا على مشروعات 
البنى التحتية للبيانات ومشروعات البيانات ا مفتوحة. وف الواقع وكما أشرنا إلى ذلك في 
الفصل الثالث» فإن الكثير من هذه القضايا التي تؤثر على البيانات الكبيرة تؤثر بشدة في 
مشروعات البيانات المفتوحة. فعلى سبيل «JULI‏ فإن بعض مواقع البيانات المفتوحة لا تعد 
أكثر من كونها مقالب نفايات للبيانات ذات المتغيرات الانتقائيةء إذ إن هذه المواقع منظمة 
بشكل سيئ للغاية وهي ذات بنية ضعيفة تماما وبياناتها غير نظيفة» وهي تفتقر إلى 
مجموعات التسجيل الكاملةء والتوثيق» والسياسات المتعلقة بالحفظء والنسخ الاحتياطيء» 
والتدقيق» وإعادة الاستخدام: والخصوصية والسياسات الأخلاقية. 

فنحن يتعين علينا أن نكون حريصين للغاية من أجل أن ندرك أن ثورة البيانات لا تزال 
في أطوارها التمهيدية وهي تتمتع بخصائص الجنين فيما يتعلق بالنضج والتطور, وفي الوقت 
الراهنء يبدو أن التسابق يتجه نحو طرح نظم تهدف إلى استعراض الإمكانيات وتأمين حصة 
سوقية مبكرة دون بذل الجهد الكافي لتفحص المصداقية والفعالية وا منفعة» أو لتفحص 
القضايا الإدارية واموارد البشريه التي تتعلق بالجاهزيه المؤسسيهة ومجموعات المهارات 
امناسبة. وف الواقع. فإن شعار بعض المشروعات هو أن تتجه نحو ما هو مستهجن بشكل 
مبكر ثم تتعامل مع القضايا التي Us‏ على أساس انتشارها. 

ونتيجة لذلكء فإن البحوث المركزة بشكل كبير والمصممة من أجل تحديد طبيعة ومدى 
أوجه القصور الفنية وال مؤسسية للبيانات الكبيرة والسانات المفتوحة والبنى التحتية للبيانات 
لا تزال متأخرة بشكل واضح مقارنة بأعمال التطوير الأخرى. ولكن مثل هذه البحوث 
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القضايا الفنية lg‏ تلد ^ لتنظيمية 


تظل حيوية للغاية لإنشاء أنظمة تقدم اكتشافات ونتائج صحيحة» ومن شأنها أيضا أن 
تضيف قيمه كافيه للمؤسسات التي تتبنى وتستخدم هذه البحوث. ويتعين Ol‏ يتم إجراء 
هذه البحوث عبر قطاعات متعددة وعر الأنواع المختلفة من البيانات وذلك من أجل 
تأسيس القضايا والحلول المتعلقة بالبيانات والأنظمة المختلفة. وعلاوة على ذلكء يتعين أن 
يتم تخصيص استثمارات من أجل زيادة وصقل مهارات الموظفين الحاليين وتدريب جيل 
جديد من علماء السانات» ودون إجراء مثل هذه البحوثء. فإن SOLLI‏ الكبيرة. والسانات 
المفتوحة والبنى التحتية OLLU‏ رها ستعاني أضرار السمعة التي ستؤدي في نهاية المطاف 
إلى بطء في نشرها وتبنيها. وهناك مجموعة أخرى من القضايا التي ستؤدي الدور ذاته 
وهي القضايا المتعلقة بالآثار الأخلاقية والاجتماعية والسياسية لأنظمة البيانات الجديدة 
وهو ما يركز عليه الفصل التالي. 
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الفصل العاشر 


(Ethical, Political, Social, and Legal Concerns) 


كما نوقش في الفصل السابع» يتم تكوين وتوظيف البيانات للعديد من الغايات التي 
تشمل حكم ال مجتمعات. وإدارة المنظمات» والتوسع في الأرباح» وتنظيم الأماكن. وف جميع 
هذه الحالات» 343 البيانات مدخلات أساسية à‏ الأنظمة التي يتم تنفيذهاء للمفارقه»ء لغرض 
ATRN‏ أكثر أماناء وأمناء وتنافسيةء ]3 «do‏ وكفاءق ‏ واقافية. ومساءلة: على 
الرغم من أنه يتم القيام بذلك من خلال العمليات التي تراقب وتفرض النظام» وتكبح» 
339« 239( وتستغل الناس. فهناك توازن دقيقء في هذه الحالةء بين استخدام البيانات 
بطرق تحريرية وتمكينية» وبين استخدام البيانات من أجل تحقيق أغراض الفرد الشخصية 
وإلحاق الضرر بالآخرينء أو استخدام البيانات بظرق تتعارض مع رغبات هؤلاء الذين 
تمثلهم هذه البيانات. ولا يتعلق الأمرء مع ob «US‏ تستخدم البيانات ببساطة في أشياء 
جيدة أو أشياء سيئة: فالمشكلة أعقد من ذلك بكثير. وفي غالب الأحيان فإن النتائج التي 
تظهر على أنها متعارضة يتم تجميعها سويا لدرجة أن الأشخاص هكن تحريرهم أو إجبارهم 
في الوقت نفسه - وهم يحصلون على منافع شخصية في الوقت ذاته الذي يقعون فيه 
في مصيدة النظام الذي يسعى إلى تحقيق مكاسب من وراء مشاركتهم. وفي مصطلحات 
Althusser (1971)‏ تعمل dis‏ هذه الترتبات من خلال الاستجواب» وتوريط الناس عن 
طريق منطقها وذلك من خلال الإقناع والحوافز. فعلى سبيل ال مثالء تمنح بطاقات الولاء في 
الأسواق للعملاء خصومات ف الوقت ذاته الذي تعمل هذه البطاقات على تأسيس الولاء 
تجاه المتجر وتكوين قدر من البيانات التي يتم استخدامها من أجل محاولة بيع المزيد من 
البضائع لهؤلاء العملاء» مما يؤدي إلى زيادة الأرباح. وبالمثل: فإن تمن حصولك على الأمان 
من الهجمات الإرهابية هو المراقبة التي تنتهك خصوصيات جميع الأفراد في المجتمع؛ حيث 
Las‏ المواطنون على الأمان مقابل خصوصيتهم. 
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الفصل العاشر 


إن تكوين البيانات والعمل الذي تقوم به مثل هذه البيانات محاط بشكل جوهري 
مخاوف أخلاقية:» واجتماعية» وسياسية. ومثل هذه المخاوف كانت لوقت طويل مثار 
إدراك ومجادلات داخل المنتديات العامة وال منتديات العلميةء مما أدى إلى صياغة مجموعة 
كبيرة من الإرشادات الأخلاقية والمهنية والتشريعات التي تحدد كيف يتم إنتاج إدارة, 
مشاركة» واستخدام البيانات. فليس هناك أي شكل من أشكال إنتاج وتحليل البيانات خال 
من مثل هذه المخاوف» وحتى المشاريع العلمية التي يبدو من الناحية الظاهرية أنها غير 
خطرة ومحايدةء يمكن أن تثير أسئلة أخلاقية ويكون لها توابع اجتماعية وسياسية. فعلى 
ميل Le) «JEU‏ يبد alb‏ آن قياس d alil eld‏ النيعية يكون مقتصراً على فيه 
الظواهر الطبيعيةء ولكن من الممكن أن يتم استخدام ذلك أيضا في تشكيل السياسات التي 
تؤثر ف حياة الناس داخل مثل هذه الأنظمة. إن مثل هذه الحوارات الأخلاقية مستمرة 
وتتطور واحدة تلو الأخرى مع المجال الاستطرادي الأشمل الذي يتعلق بالاتجاهات والآراء 
الاجتماعيةء وتطور التقنيات الجديدة. وفيما يتعلق بالأخيرةء فإن توسيع البيانات الصغيرة 
داخل البنى التحتية للبيانات» وإنشاء سوق البيانات الهائل» وفتح البيانات المؤسسية: 
وتدفقات البيانات الكبيرة يطرحان آسئلة أساسية أخلاقية. واجتماعيةء وسياسية: إذ إنها 
تعدل بشكل جذري مشهد البيانات. إن حجم وتنوع البيانات التي يتم تكوينها عن جميع 
مجالات الحياة اليومية والعام الذي نعيش فيه اليوم ينموان بشكل yho‏ وهذه البيانات 
هي أكثر من أي وبا مضق رمق یا منايكييه الوقيتقار وت ص و وشوو بها وترابطها. 
فما كان في الماضي Pal‏ أو محولا أصبح الان وبشكل متزايد مكشوفا أمام محموعة 
متنوعة من المصالح» وعمليات اتخاذ القرار داخل الحكومات» وأصبحت الأعمال توجه 
بالبيانات بشكل أكبرء ومدعومة بالدليل وأكثر اعتمادا على التقنية (تكنوقراطية). 

بناقش هذا الفصل مجموعة مختارة من المخاوف الأخلاقية, والاجتماعيةء والسياسية؛ 
والقانونية التي تثيرها ثورة البيانات» وهذه المخاوف تشمل مراقبة البيانات وتعقب 
«SL UJ‏ والخصوصية» وأمن البيانات» والتشخيص. والتصنيف الاجتماعي والخطوط 
الحمراء (Redlining)‏ والتي تعني ممارسة الحرمان أو زيادة التكلفة في الخدمات لمناطق 
لها غالبية عرقية محددة بناء على البيانات» والتحكم في الانسلالء والحوكمة التوقعية: 
وحوكمة المؤسسات» والاعتماد التام على التقنية وحوكمة الشركات والإغلاق التقني» والملكية 


YAY‏ 859 البيانات البيانات الكبيرةء والبيانات المفتوحةء والبنى التحتية للبيانات» والنتائج المترتبة عنها 


AVA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


المخاوف ASY‏ والسباسبةء والاجتماعية» والقانونية 





وحقوق الملكية الفكرية. فالفصل يناقش كيفية التفكير في كل قضية من هذه القضاياء مع 
الآراء المتباينة داخل كل ele‏ على حدة وبين العلوم المختلفة بعضها البعض» وكذلك داخل 
وبين الشركات والحكومات وا مجتمع المدني» ومن لديه أجندات مختلفة» ومصالح مكتسبة: 
وحساسيات سياسيه. ولذاء فإنه لا توجد إجابات سهله لحل هذه القضايا التي يناقشها 
هذا الفصلء في حين أن الحلول تتكون دوما من تسويات وحلول وسط. ومن المؤكد. على 
ما ذكرناء أنه كلما تنتشر ثورة البيانات» فمن ال مرجح أن تزداد حدة المناقشات والجدال 
بشأن هذه المخاوف. فوا عند القيام محاولات من أجل صياغة تشريعات جديدة 
للتعامل مع التطورات التقنية التي تساعد على انبثاق طرق جديدة لإنشاء وتعزيز وتحليل 
البيانات» ومن تم تؤدي إلى ظهور LLAS‏ جديدة مما يجعل من التشريعات والقوانين 
القديمة تشريعات وقوانين عفا عليها الزمن. 


تعقب السانات ومراقبة السانات :(Data Shadows and Dataveillance)‏ 
كما ناقشنا في الفضول السابقةء يتم تكوين كمية هائلة من البيانات في الوقت الراهن 
وذلك فيما يتعلق بال مواطنين في جميع ولايات الدولة. إن إنتاج وتحويل مثل هذه الكمية 
من البيانات ينمو ويتزايد باطراد» حيث تسعى الدولة والشركات ومنظمات ال مجتمع ا مدني 
بشكل فعال للحصول على البيانات المتعلقة بمواطنيهم وعملائهم والأعضاء المشتركين في 
أنشصطتهم. وفي الواقع» أصبح من الصعوبة بمكان أن يؤدي الفرد جزءًا من حياته اليومية 
دون أن يترك أثرًا لذلك بسبب الدور غير المباشر للتقنيات الرقمية والبرامج واستخدام 
امعرفات الداليه )2011 .(Kitchin and Dodge‏ فحتى ولو م يقم المشتري باستخدام 
بطاقته الائتمانية لشراء البضائع من المتاجرء إلا أن حضور هذا المشتري قد تم تسجيله 
من خلال كاميرات المراقبة» وحتى لو استخدم الشخص اسم مستخدم مجهول على وسائل 
التواصل الاجتماعي فإنه يتم تسجيل عنوان بروتوكول الإنترنت (IP Address)‏ وعنوان 
التحكم بالوصول للوسائط (MAC Address)‏ ومن ثم فنحن نترك آثار البيانات بشكل 
روتيني في أعقابناء على es JI‏ من أننا في الغالب لا نمتلك السيطرة الكاملة على شكل ومدى 
وكيفية استخدام هذه الاثار. 
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Ss‏ أشار )2011( Koops‏ على سبل «JULI‏ قان هيئة حمابة السانات الهولندية 
قدرت أن المواطن الهولندي العادي مندرج ق نحو 0٠١0 - YO-‏ قاعدة بيانات» في حين 
أن الممواطنين الأكثر نشاطا من الناحية الاجتماعية مندرجون فى نحو ٠٠٠١‏ قاعدة بيانات. 
ولا تشتمل قواعد البيانات هذه على الآثار الرقمية للمواطنين فحسب (البيانات التي 
يتركها المواطنون أنفسهم t‏ أعقابهم). ولكنها تتضمن أيضًا سانات الصور Data) Lail‏ 
5 االخاصة بالآفراد (البيانات عن المواطنين التي ينشئها 03,2( وهي توفر 
بشكل متزايد عملية تعقب البيانات الخاصة بالموقع والتفاعلات وال معاملات عبر المكان 
والزمان )2011 (Clarke 1994a; Lyon 2007; Dodge and Kitchin 2005; Koops‏ 
وعلاوة على ذلك» ففي حين أن الآثار الرقمية والصور التخيلية للبيانات سريعة الزوال ولا 
تدوم إلا فترة محدودة للغايةء فإن النسخة الرقمية منهما تدوم بشكل كبير للغاية ويمكن 
تخزينها في قواعد البيانات لفترة غير محدودة )2011 (Koops‏ مما يؤدي إلى إنشاء 
عام من الممكن له أن يتذكر جميع نقاط البيانات ولا ينسى على الإطلاق Dodge and)‏ 
.(Kitchin 2007b‏ فهذه الآثار الرقمية والصور التخيلية للبيانات يتم تفتيتها وتقسيمها 
ونشرها عبر الكثير من المنظمات والخوادم» وهي تكون عرضة للدمج والتقسيم Raley)‏ 
2013(. وف أفضل الأحوال. تشكل الآثار الرقمية والصور التخيلية للبيانات القليل من 
اليرؤى -.رؤى فخدودة من زوايا مرتفعة جزئية من:هواقف محددة مع إسقاط الرؤى 
المحددة )2002 (Amin and Thrift‏ - وذلك بدلا من تمحيص هذه الآثار والتخيلات 
سويا من أجل تكوين رؤية شاملة وعامة تحيط بكل شيء. وعلى الرغم من ذلك وإذا 
وضعنا في اعتبارنا ارتباطية البيانات وقيمة تضخيم البيانات. فإن الاتجاه السائد سيكون 
تجاه تجميع وجهات النظر المحدودة من أجل تكون تصور أكثر قوة. 

وإجمالاء توفر الآثار الرقمية والصور التخيلية للبيانات سجلا مفصلا بحياة المرء اليومية 
وأنماط استهلاكه» وعمله. وسفره. واتصالاته. ولعبه» وتفاعلاته مع المنظمات. وأفكاره 
واهتماماته. وليس الأفراد فحسب هم من يقعون تحت طائل هذه المراقبة الشاملةء ولكن 
هذه المراقىة تشمل أيضا الأشياء والمؤسسات والتعاملات وال مناطق Dodge and Kitchin)‏ 
2005( وم يحدث أبدا في السابق أن يتم تكوين مثل هذه الكمية من البيانات عن حياة 
الناس الاقتصادية والاجتماعية بسهولة بالغة» وأن يتم إتاحة هذه البيانات على نطاق واسع 
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للغاية من خلال أسواق البيانات والبنى التحتية للبيانات وميادرات السانات المفتوحة. 
وف الواقع: فإن اكتساب الوصول إلى البيانات الحساسة ليس مقتصرا على الحكومات 
والشركات والمنظمات: وذلك بسبب أن مراقبة النظراء أصبحت أمرا أكثر انتشارا نتشكل 
نسبىي دون معرفة أو دون الحصول على إذن الشخص الخاضع للمراقبة Andrejevic)‏ 
2007( وبالطبعء كان هذا الأمر متاحاً على الدوام من خلال التطفل والقيل «JUJls‏ ولكنه 
أصبح أكثر سهولة في الوقت الحالي من خلال الإنترنت سواءً كان هذا من خلال البحث عن 
البيانات أو شراء تلك البيانات» أو من خلال استعراض سحلات الأجهزة الرقمية كالهواتف 
الخلويةء وبرامج تصفح الإنترنت» أو برامج الملاحة بالأقمار الصناعية في السيارات... وغير 
ذلك أو من خلال وضع أجهزة مراقة رخصة Loud‏ مثل الكاميرات الدقيقة المصغرة. وكما 
ناقشنا في الفصل الثاني» فإن سماسرة البيانات يسمحون بدراسة تواريخ الأشخاص وذلك 
فيما يتعلق ببعض المسائل مثل الحالة dae ze I‏ والإفلاسء وملكية العقارات» والتاريخ 
الوظيفيء والسجلات الجنائية» والحالة الضريبية» ودعاوى العنف الجنسي أو العنف الأسري, 
والخلفية التعليمية... وغير ذلك. 

ومن ثم فإن طوفان البيانات مكشوف أمام مراقبة البيانات والاستغلالء فمراقبة 
البيانات» تعد أحد أساليب المراقبة التي يتم تفعيلها من خلال فرز وتدقيق مجموعات 
البيانات وذلك بغرض التحديد واطراقبة: c ls‏ والتنظيم» والتنبؤء والتوجيه 
(Clarke 1988; Raley 2013)‏ وتعمل مراقبة السانات على تحويل الكميات الهائلة 
من الأفعال والأفكار التي تمثلها هذه البيانات إلى صورة واضحة ومقروءة ونماذج 
واضحة للحكم على الأشباء )359 :2004 «(Curryet al.‏ وهي مكون أساسي من 
الأشكال الحديثة للحوكمة والحاكمية. وفيما يتعلق باستخدام البيانات» وكما ناقشنا 
في الفصل السابع: يتم استخدام البيانات من أجل توصيف واستهداف الأشخاص 
وذلك بهدف زيادة الأرباح. ومن ثم ففي غالب olo VI‏ يتم إعادة تحديد الغرض 
من البيانات واستخدامها في أغراض م تكن مقصودة على الإطلاق عند تكوين هذه 
البيانات» ومن ثم فإن مراقبة OVI‏ الرقمية والصور التخيلية للبيانات يثيران العديد 
من ال مخاوف الإضافية وخاصة فيما يتعلق بقضايا مثل الخصوصية. والتنميط والفرز 
الاجتماعي» وإقرار أساليب متعددة للحوكمة. 
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: (Privacy) duo gas! 
حقا من حقوق‎ A53 الخصوصية هي حالة يتوقعها ويقدرها الكثير من الناس» وهي‎ 
الإنسان الأساسية» وهي من الحقوق المقدسة في الكثير من القوانين الوطنية والدولية.‎ 
وق الولايات المتحدة: فإن الخصوصية مغطاة بشكل كبير ق القوانين اللمسماة قوانين‎ 
الخصوصية: أما في الاتحاد الأوروبيء فهي تقع ضمن نطاقات قوانين حماية البيانات‎ 
والخصوصية مصطلح متعدد الأبعاد فيما يتعلق بمعناه. وهو‎ .(Minelli et al. 2013) 
يستخدم في غالب الأحيان في طرق معتمدة على السياق. ولكن على وجه العموم هو‎ 
يشير إلى الممارسات ال مقبوله فيما يتعلق بالوصول إلى والإفصاح عن المعلومات الشخصية‎ 
ومن الوسائل ال مستخدمة ق إيضاح‎ .(Elwood and Leszczynski 2011) والحساسة‎ 
الأبعاد المتعددة للخصوصية دراسة الوسائل العديدة التي يمكن من خلالها انتهاك‎ 
.)10.1 انظر الجدول رقم‎ Solove 2006) الخصوصية والأضرار المرتبطة بهذه الانتهاكات»‎ 
من خلال هذا التصنيف هو أن انتهاك الخصوصية يمكن أن يكون له‎ LJ فالذي يتضح‎ 
العديد من التآثيرات على الرفاهية الجسدية والعاطفية للأفراد: وتجعل هؤلاء الأفراد‎ 
المضرة التى يقوم بها الآخرون: ويجعلهم كذلك عرضه لاختلال توازن‎ äh للأنش‎ d o, 

السلطات غير المتمائل. 

ويوجد بعض الشكوك بأن مفهوم الخصوصية يتغير. وكما تمت الإشارة odel‏ فإن الناس 
عرضة الآن لمستويات من الفحص والتدقيق وكذلك أساليب المراقبة أكثر من أي وقت مضى. 
فا مهام التى كانت تعد في ال ماضي خاصة إلى حد كبيرء يتم الآن مراقبتها وتسجيلها. على 
سبيل «JULI‏ فإن البرامج التي كان يشاهدها الشخص على التلفاز م تكن معروفة في ال ماضي 
إلا لمن هم حاضرون مع الشخص ذاته ف الغرفة ذاتهاء في حين أنه يمكن لشركات التلفاز 
I‏ مراقبة ما الذي يتم مشاهدته على كل تلفاز على حدة وذلك بسبب استبدال البث 
التلفزيوني وحيد الاتجاه بالتواصل GLS‏ الاتجاه. وما يشتريه المرء كان في السابق معروفا 
للعميل والشخص الذى يحدم هذا العميل فحسب والان شيف هذه المعلومات التي يتم 
جمعها بشكل روتيني من خلال إدراج النقود الرقمية في عملية الدفع متاحة لشرائح أكبر. 
والأماكن التى كان يسافر إليها الفرد لم تكن سابقا معروفة إلى حد كبير لأي شخص ما عدا 
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المسافرين ومرافقيهم: ولكن في الوقت الراهن أضحى العديد من الأنظمة تكشف موقع 
الشخص والطرق التي اجتازها كنظم الملاحة باستخدام الأقمار الصناعية (GPS)‏ المثبتة 
في السيارات أو أجهزة الهواتف الخلويةء ونظام تثليث الإشارات ف أبراج شبكات الهاتف. 
وأنظمة النقل العام التي تعتمد على استخدام شريحة تحديد الهوية باستخدام موجات 
الراديو (RFID)‏ في أنظمة أو أكشاك دفع رسوم المرور. ومثل هذه البيانات التي تنتجها 
هذه الآنظمة يتم إعادة تجميعها ونشرها وبيعها. 


الجدول رقم )٠١ - ١(‏ 
تصنيف الخصوصية 


جمع ال معلومات Information‏ يقوم بها الشخص 
Collection‏ جواب ‏ |الأشكال المتعددة من الاستجواب أو التقضي من أجل 


-» على المعلومات 


الإهمال à‏ حماية المعلومات ال مخزنة من التسريبات 
والوصول إليها بطريقة غير AE‏ 


الاستخدام الثانوي | يتم استخدام ا معلومات التي تم تجميعها لغرض معين 
à‏ أغراض أخرى دون الحصول على موافقه الشخص 













معالجة المعلومات 


Information Processing‏ موضوع البيانات 


الاستبعاد الإخفاق في السماح للشخص موضوع البيانات 
معرفة OUI‏ التي متلكها الاخرون عنه والمشاركة 


في doleo‏ واستخدام هذه البيانات» وهذا يشمل 
الإقصاء واممنع من التمتع بالمقدرة على الوصول إلى 
هذه البيانات وتصحيح الأخطاء الواردة فيها. 
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الكشف عن ال معلومات عن شخص ما والتي تؤثر في 


الطرق التي يحكم بها الاخرون على شخصيته 
الكشف عن عري أو حزن أو الوظائف الجسدية 
لشخص ما 

53b; [Information‏ إمكانية الوصول إل اللعلومات 


Dissemination 
التهديد بالكشف عن معلومات شخص ما‎ 


خدمةه أهداف UR P‏ هت 


الأعمال الانتهاكية التي تزعج هدوء أو انعزال شخص ما 
الانتهاك التدخل المتعلق | التدخل في قرارات الشخص موضوع البيانات التي 
Invasion‏ بالقرارات تتعلق بشئونه الخاصه. 


المصدر: تم تجميعه من )2006( .Solove‏ 

وعلاوة على ذلك فنحن نعيش ف عام أكثر انفتاحا وشفافية بكثير عما اعتدنا عليه سابقا. 
فالمعلومات التي كانت تعد خاصة في السابق يتم مشاركتها الآن بشكل أكثر حرية كالسير 
الذاتية من خلال موقع لينكد إن (LinkedIn)‏ والصور والفيديوهات العائلية من خلال 
مواقع فليكر (Flickr)‏ وإنستجرام (Instagram)‏ ويوتيوب (YouTube)‏ والقصص الشخصية 
والعائلية من خلال موقع فيسبوك (Facebook)‏ والمدونات: والأفكار والمعتقدات الشخصية 
من خلال تويتر (Twitter)‏ وغرف الدردشة والتعليقات على الإنترنت. فما كان يتم مشاركته 
في السابق مع عدد لا يتجاوز أصابع اليد الواحدة من الأشخاص كأفراد العائلةء والأصدقاء 
ا مقربين» وأرباب العمل في المنزل أو المقهى المحلي أو مكتب للموارد البشرية يتم نشره الآن 
على المستوى العالمي مما يسمح لأي شخص مشاهدته وتعديله )2013 (Minelli et al.‏ 


نشر اطعلومات 
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وعلى الرغم مما ذكر سابقاء Y‏ يتصرف كل شخص بسهولة وبحرية فيما يتعلق ببياناته 
الشخصية» حتى ولو كان الشخص يتصرف على هذا النحوء فإنه لا يتوقع بالضرورة أن هذه 
البيانات سوف يتم انتقاؤهاء ومعالجتهاء وتجميعهاء وبيعها. وهم لا يتوقعون أيضا أن 
تطبيقات البرامج التي لا يوجد بها أي عنصر من عناصر وسائل التواصل الاجتماعيء والتي 
يعتبرونها تطبيقات خاصة رها تقوم بتكوين ونقل البيانات إلى مطوري تلك التطبيقات» أو 
أن بعض الشركات رها تحاول أن تقوم بالهندسة العكسية لإستراتيجيات حماية الخصوصية 
Jis‏ إخفاء الهوية من أجل إنشاء ملفات شخصية موحدة: ومع ذلك. فإن هذا الأمر 
يحدث بانتظام. على سبيل «JUL‏ وجدت صحيفة وول ستريت جورنال Wall Street)‏ 
(Journal‏ في اختبار أجرى على 101 تطبيق للهواتف ASII‏ أن 56 là. las‏ نقلت معرف 
الجهاز المتفرد للهاتف إلى شركات أخرى وذلك دون معرفة المستخدم أو الحصول على 
موافقته» وأن 47 TRA‏ أرسلت موقع الهاتفء وأن 5 تطبيقات أرسلت البيانات الشخصية 
للمستخدمين» وأن 45 تطبيقاً نم يكن بها أي ارتباط مع سياسات حماية الخصوصية التي 
مکن للمستخدمين مشاهدتها )2011 .(Efrati et al.‏ كما وجدت شركة الثقة الإلكترونية 
(TRUSTe)‏ أن 414 Ja33‏ قن Uxdas YYE« (el‏ مقون dala‏ الخصوصة وآ متاجر 
شركتي أبل وجوجل يشترطان ضرورة اشتمال التطبيقات على هذه السياسة Coterill)‏ 
2011(. ومع ذلك وكما أشار )2011( Gralla et al‏ يمكن للتطبيقات أن تتتبع وتنقل 
"عاداتك على الشبكةء olg‏ تبحث في قائمة جهات الاتصال لديكء وأن تجري مكالمات 
هاتفية دون أن 3,53« وأن تتتبع موقعك» وأن تفحص ملفاتكء وغير ذلك الكثير". 

إن مشهد الخصوصية الآن في حالة تغير مستمرء وهو يخيب كلا من التوقعات القانونية 
والاجتماعية. وبالنسبة للبعضء فإن مفهوم الخصوصية قد تعطل بشكل كبير Rambam)‏ 
Rubenking 2013‏ :2008). ويرى البعض أنه من الصعوبة ممكان المحافظة على الخصوصية 
في التطبيق العملي» كونها تحجب وتخفي تجربة ال مستخدمء وهي معوق اقتصاديء ولا يبدو 
أن معظم الناس يعارضون أن يتم التنقيب في بياناتهم» وإذا لم يكن لديك شيء لتخفيهء فما 
ا مشكلة في أن يتم معرفه بياناتك؟ )2007 .(Raley 2013: 126; Solove‏ وبالنسبة للبعض 
VI‏ 2(« فإن الخصوصية حق يتعين حمايته لأنه من الحقوق التأسيسية ل "المواطنة المطلعة 
والمتأملة" وهو مكون أساسي أيضا لحرية التعبير )2009 dis ues .(Cavoukian‏ يُرى أن 
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الخصوصية "سمة ضرورية وتأسيسية للأنظمة السياسية الدمموقراطية المتحررة" Cohen)‏ 
2 :2012( فإذا تم إنكار الأشكال المتعددة من الخصوصية التي تم إيجازها في الجدول 
رقم B :.)3١-1١(‏ الناس سيكونون عرضة لأنوع مختلفة من الأضرار الشخصية وأشكال 
الحوكمة الأكثر ضررا. ويبدو أن جميع المعلقين يؤيدون وجهة النظر القائلة بأن تشريعات 
الخصوصية م تعد ملاتمة للغرض التي شرعت من اجله» dis‏ يتعين تحديث تلك التشريعات 
لكي تلائم الأوقات التي نعيشها الآن. 
الجدول رقم )٠١ - Y)‏ 
مبادئ اللممارسة العادلة للمعلومات 
الوصف 


الإاخطار (Notice)‏ يتم إخطار الأفراد Ob‏ بياناتهم يتم إنشاؤها ويتم إعلامهم بالغرض 
الذي سيتم استخدام هذه البيانات فيه 












الاختبار (Choice)‏ يتمتع الأفراد jul db yx‏ المشاركة أو يؤترون عدم aS LZ. LUI‏ ودلك 
فيما يتعلق ما إذا كانوا يرغبون في استخدام بياناتهم أو الإفصاح 


عنها وكيفية القيام بذلك 


امموافقة (Consent)‏ يتم إنشاء البيانات والإفصاح عنها فحسب بعد موافقة الأفراد 
امعنيين 
الأمن (Security)‏ يتم حماية البيانات من الفقد» وإساءة الاستخدام» والوصول غير 


e ^al‏ لك والإفصاح عنهاء وتعديلها أو تدميرها. 


التكامل (Integrity)‏ تكون السانات موثوقة ودقيقة وكاملة وحالية 













الوصول (Access)‏ يمكن للأفراد الوصول إلى بياناتهم الشخصية والتحقق منها والتثبت 
منها 


(Accountability) المساءله‎ 





ذكرها وأن يكون لديه الوسائل اللازمة من أجل ضمان الالتزام بهذه 
امادىئ 





.(Minelli et al. (2013: 156 امصدر:‎ 
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)٠١ - Y) الجدول رقم‎ 


أنواع المعلومات ابلحمية 















المعلومات الشخصية ال معرفة | المعلومات الحساسة: هي أي | المعلومات الأخرى التي يمكن 
(PI)‏ هي أي معلومات تعرف | معلومات asus‏ للكشف غير | استخدامها لتخمين هوية شخص 
erm‏ بصورة مباشرة أو غير | المصرح لها أن يسبب الإحراج أو | ما 


الضرر لشخص ما 


اد 


العنوان البريدي / الرمز البريدى | الآراء السياسية هوية ملف تعريف الارتباط 
(cookie)‏ 


E ET IFFT TETUR 
الوت سرا ا د‎ — eniin 


رقم رخصة القيادة الحالة الاجتماعية / الحياة 


الجنسية 
رقم الحساب الال sm. Gen‏ لإ 


E TT wl 


المصدر: مقتىس من 159 :2013( .(Minelli et al.‏ 
s‏ الوقت all‏ فإن تشريعات الخصوصية مبنية حول الحقوق الشخصية وا موافقة 
المتعلقة بإنشاء»ء واستخدام» والإفصاح عن البيانات الشخصية )2013 .(Solove‏ وهي تتكون 
من سبعة مبادئ عاطيه للخصوصية )156 :2013( Minelli et al.‏ (انظر الجدول رقم )٠١ - Y‏ 
وفي إطار هذه الممبادئ» فإن الأفراد. من الناحية النظرية:» يتم منحهم الحق للتحكم في بياناتهم 
الشخصية ومنح موافقتهم للاخرين فيما يتعلق بهذه البيانات. وعلاوة على «MUS‏ فإنه يتعين على 
مقتنيي البيانات الالتزام بقوانين حماية البيانات التي تقيد الإفصاح عن ال معلومات الشخصية 
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(Personally Identifiable Information- PII) 4-3,‏ وا معلومات الحساسه» والسانات 
الأخرى التي يمكن استخدامها للاستدلال على الشخصية (انظر الجدول رقم (V«-Y‏ وتؤيد تقليص 
الببانات بحيث يقتصر إنشاء السانات على السيانات الضرورية لتحقيق غرض معنن Tene and)‏ 
.(Polonetsky 2012‏ وعلى وجه العموم: فإن الحل لاشتراطات المعلومات الشخصية المعرفة 
(PII)‏ هو استخدام أساليب إخفاء الهوية مثل عدم تحديد الهوية (إخفاء المعلومات الشخصية 
المعرفة)» والأسماء المستعارة: والتجميع: بالإضافة إلى التشفيرء والتخزين الآمن» والقيود الخاصة 
بالوصول إلى ا معلومات )2011 (Coterill‏ 

وأخيراء تجدر الإشارة إلى وجود العديد من المشاكل الإدراكية والبنيوية المرتبطة 
بتشريعات الخصوصية الحالية. 

وتحاول الدول بصورة روتينية التحايل على قوانين الخصوصية وذلك من أجل أغراض 
الأمن وجمع ال معلومات الاستخباراتية» بحسب ما تم الكشف عنه ع بواسطة برامج 
تحليل وجمع البيانات السرية في الولايات المتحدة الأمريكية: والمملكة المتحدة: والعديد من 
الحكومات الأخرى (انظر الفصل السابع). كما أن الكثير من الشركات لا تشعر بأنها مجبرة 
على تقديم سياسة الخصوصية للأفراد وذلك لأن هذه الشركات تدعي أنها تجمع معلومات 
مجهولة المصدرء ومن ثم فهي لا تقع تحت طائلة ممارسات المعلومات العادلة. أو رها 
تقدم هذه الشركات سياسة الخصوصية, وذلك عند الاستهلال الأولى للالتزامات (على سبيل 
المثال» عند تثبيت برنامج ما أو الاشتراك في خدمة ما) وتكون هذه السياسة مصاغة بلغة 
معقدة وغامضة: وعادة ما تشتمل على الاحتفاظ بالحق في تعديل هذه السياسة في وقت 
لاحق دون تشاور إضاق مع الشخص )2013 (Rubinstein‏ 

وفيما يتعلق بالبيانات التي تم تكوينها بدون معرفة الشخص,» فمن الصعوبة مكان 
اكتشاف مثل هذه الممارسات ومواجهتها من الناحية القانونية. آما في حالة الخصوصية 
ذات الإدارة الذاتية»ء وكما شرح )2013( Solove‏ فهي ببساطة مرهقة للغاية وبالغة 
الصعوبة على الأفراد كونها تتطلب قيامهم بتنظيم خصوصيتهم عبر الكثير من الكيانات» 
والموازنة بين التكاليف والمنافع ال مرتبطة بال موافقة على الشروط والبنود دون معرفة كيف 
سيتم استخدام هذه البيانات في الوقت الحالي وف المستقبل: وأيضا تقييم التأثيرات الشاملة 
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والتراكمية لبياناتهم التي سيتم دمجها مع مجموعات البيانات الأخرى. وبناء على US‏ 
أشار )2013( Solove‏ إلى أن: 
)1( الناس لا يقرؤون سياسات الخصوصية؛ )2( إذا 1,8 الناس سباسة الخصوصةء 
فإنهم لا يفهمونها؛ (3) إذا قرأ الناس سياسة الخصوصية وفهموهاء فإنهم في الغالب 
يفتقدون الخلفية الكافية لاتخاذ اختيار مبني على المعرفة؛ (4) وإذا قرأ الناس سياسة 
الخضوصية وفهموها. وكان بإمكانهم اتخاذ اختيار glo‏ ومبني على xl‏ 43« فإن 
اختيارهم ممكن أن ينحرف وذلك من جراء العديد من الصعوبات المرتبطة باتخاذ 
القرار )1888 :2013 .(Solove‏ 
ومن ثم فإن الموافقة تكون في غالب الأحيان ممارسة عدمة الحدوى Rubenstein)‏ 
2 ) وذلك عندما يقوم الأفراد عن غير قصد بالتخلىي عن الحقوق دون إدراك لمدى أو 
عواقب الفعل الذي يقومون به. ومن ثم» فإن سياسات الخصوصية في غالب الأحيان تخدم 
إخلاء المسئولية للشركات بصورة أكبر مما تخدم عملية ضمان الخصوصية للمستهلكينء 
.(Tens and Polonestky 2012)‏ وعلاوة على ذلك. فمن الواضح أنه pas à‏ البيانات 
الكبيرةء فإن إستراتيجية إزالة التعرف على الأشخاص توفر شكلا ضعيفا فحسب من أشكال 
الخصوصية لأن من الممكن القيام بالهندسة العكسية للعملية وذلك من خلال التنقيب في 
مجموعات السانات وتجميعها )2010 .(Narayanan and Shmatikov‏ فعلى سسل JULI‏ 
يشرح نيف سينحجر (Niv Singer)‏ من شركة تراكسك (Traxc)‏ (واممقتىس Minelli et à‏ 
(al. 2013: 31‏ عملية إزالة التعرف على الأشخاص كما ياى: 
يمكن في بعض الأحيان أن يكون من الصعوبة بمكان توحيد الملفات الشخصية 
الاجتماعيه المستخدم واحد والذي رها يستخدم العديد من الأسماء أو تعاملات 
مختلفة في كل واحدة من شبكات التواصل الاجتماعي. ولذا فلقد قمنا ببناء 
خوارزميات تقوم بالتنقيب في العوامل الأساسية التي تشتمل على محتوى 
المشاركات والموقع على سبيل JELI‏ لا الحصرء وذلك من أجل توفير توحيد للهوية 
بشكل فعال إلى درجة كبيرة. 
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ونتيجة لهذه ا مخاوفء يدرس الاتحاد الأوروبي منذ فترة سياسات حماية البيانات (انظر 
المفوضية الأوروسة ;2011 European Commission 2012. Hon et al. 2011; Koops‏ 
(Rubinstein 2013‏ وتشتمل اقتراحات الاتحاد الأوروبي على ol‏ تكون الموافقة ضريحة 
وليست ضمنية أو مفترضةء وأن يكون وصول الأفراد إلى البيانات الخاصة بهم i‏ وشاملا 
وآن يكون للأفراد الحق ف قابلية النقل للبيانات بمعنى المقدرة على نقل البيانات الشخصية 
من مزود خدمة إلى مزود آخرء والحق في أن يتم نسيان الشخصء حيث هكن للأفراد آن 
يطلبوا حذف بياناتهم إذا A‏ تكن هناك أي أسس مشروعة للاحتفاظ بهذه البيانات» وأن 
تنطبق هذه القواعد أيضا على الشركات خارج الاتحاد الأوروبي إذا كانت هذه الشركات عاملة 
في سوق الاتحاد ELSEN‏ وتقدم خدماتها مواطني دول الاتحاد European 2012) ELSEN‏ 
mission‏ 2ه وباطمثلء تقدمت مفوضية التجارة الفيدرالية في الولايات المتحدة 
الأمريكية باقتراح يتضمن ثلاثة تعديلات من أجل توفير حماية أكثر فعالية للخصوصية: 
الخصوصية من خلال التصميم حيث يتم تأسيس الخصوصية بشكل متأصل في كل مرحلة 
من مراحل تطوير الطمنتج؛ منح الشركات والمستهلكين خيار مبسط منحهم المقدرة على 
اتخاذ القرارات بشأن بياناتهم الخاصة: وهذا يشمل تطبيق آلية eas‏ التتبع والحصول على 
الموافقة الصريحة فيما يتعلق بالبيانات الحساسة: أو الحصول على موافقة قبل استخدام 
البيانات في غرض مختلف بشكل مادي عن الغرض الذي تم من أجله تكوين هذه البيانات؛ 
وشفافية أكثر فيما يتعلق بالبيانات وجمعها واستخدامهاء هذا يشمل الوصول Jos‏ 
إلى البيانات من قبل هؤلاء الذين تمثلهم تلك البيانات» مع منحهم المقدرة على تصحيح 
أو حذف السانات (مفوضية التجارة الفيدرالية 2012 (Federal Trade Commission‏ 
وتنشد إستراتيجية الخصوصية من خلال التصميم تطبيق إستراتيجية مختلفة عن الالتزام 
التشريعي والتنظيمي» وهي تقترح أن تكون الخصوصية هي الوضع الافتراضي للعملية؛ 
أي نظام يسعى dlei‏ وبوضوح إلى ضمان الخصوصية )2009 .(Cavoukian‏ ومن OUS‏ 
المبادئ السبعة المذكورة في الجدول رقم )€ - )٠١‏ أن تعزز هذا المنهج. 
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الجدول رقم )€ - )٠١‏ 
المبادئ السبعة الأساسية للخصوصية من خلال التصميم 
jabl‏ الوصف 
ينبغي أن تسعى نظم تكنولوجيا ال معلومات لتوقع الخصوصية 


اسشتاقيه Cug‏ تفاعلية؛ 
تحديد ال مخاوف امتعلقة بالخصوصية وتجنبها بدلا من السعي 
إلى حل المشاكل الناتجة عن مخالفات الخصوصية بعد حدوتها 


الخصوصيه هي الوضع الافتراضي الخصوصية محمية LI‏ ولا تتطلب أي عمل من cle‏ الآفراد 


الخصوصية مدمجه à‏ التصميم حماية duo saa)!‏ هى daw‏ أشساسية للتصميم والهندسة AS al‏ 
لأنظمة تقنية المعلومات وليست ميزة إضافية متدنية الأهمية 


الفعالية الكاملة - عائد loo!‏ | جميع المصالح والأهداف المشروعة يتم استيعابهاء بدلا من أن 
ول Ais A‏ ;4 يكون هناك مقايضات بين الخصوصية واعتبارات أخرى مثل الأمن 
الأمن من النهاية للنهاية-حماية | تكون الخصوصية جزءًا لا ljan‏ من النظام من بداية إطلاقه إلى 
كاملة طوال دورة حياة النظام | حين التخلص منه 

الوضوح والشفافية - فلتكن | تكون جميع الأجزاء المكونة للنظام وعملياته واضحة وشفافة 
مفتوحة على الدوام للمستخدمين والشركات ال موفرة على السواء وتخضع لتدقيق مستقل 
احترام خصوصية ال مستخدم - أي يجب أن يبنى النظام حول l YI‏ وأن يحمي مصالحهم» وآن 


الوقاية وليس العلاج 




























جعلها تتمحور حول المستخدم دکون ممكنا لهم 
المصدر: )2009 „(Cavoukian‏ 


لقد اقترح العديد من العلماء المتخصصين في الخصوصية وأيضا العديد من مجموعات 
الضغط الصناعية مناهج متعددة لكيفية التعامل مع قضية الخصوصية: فالعلماء 
المختصون بموضوع الخصوصية سبق لهم التطرق للمواضع التالية: الإصلاح التشريعي 
المصمم من أجل حماية حقوق المواطنين: والذي يشمل بعض القضايا كالحق في الصفحة 
البيضاء وتواريخ الانتهاء للبيانات )2011 (Koops‏ ومن الذي يكون مسئولا عن ضمان 
الخصوصية» المطورون el‏ الوكالات el‏ المستخدمونء وعن الوسائل التقنية والإدارية 
لتنفيذ هذه الأمور )2011 .(Coterill‏ وما الذي يشكلا ال معلومات الخاصة وكيفية تأطير 
الخصوصية حول المخاطر ومدى الضرر بدلا من تأطيرها حول تعريف المحتوى Hen)‏ 
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(etal. 1‏ واقترح هؤلاء العلماء أيضا دخول الأفراد في شراكات مع المطورين حيث 
يكون بإمكانهم أن يختاروا بشكل أكثر استباقية ما البيانات التي يرغبون في نشرهاء 
ولمن تنشر هذه البيانات» وتحت أي ظروف تنشر هذه البيانات. كما اقترحوا أن تتيح 
الشركات للمستخدمين الوصول إلى بياناتهم الشخصية بصيغة قابلة للاستخدام وذلك من 
أجل مصلحتهم الشخصية. وأخيراء اقترحوا أن تقوم الشركات بمشاركة الثروات الناتجة 
عن تحويل السانات الشخصية إلى أموال Tene and Polonetsky 2012; Rubinstein)‏ 
3. وكمثال على هذه المشاركة المفيدة لكلا الطرفين à‏ الثروات المتحصلة من بيع 
بيانات الشبكات الذكية حيث يتم استخدام البيانات التي تم تكوينها من خلال العدادات 
الذكية والمتعلقة باستهلاك أفراد الأسرة للكهرباء من قبل شركة الكهرباء من أجل ضمان 
كفاءة التزويد بالكهرباءء ويتم مع ذلك توفير تطبيقات لأفراد الأسرة لتمكينهم من مراقبة 
استخدامهم الشخصي وأن يعدلوا سلوكياتهم من أجل توفير المال. إن سوق الصناعة: إلى حد 
كبير» يريد إما الاستمرار في الإمدادات الحالية على ما هي عليه 9l‏ تقليل هذه الإمدادات» 
مع إدارة الخصوصية من خلال تنظيم يقود السوق ولا يكبح الاستفادة الاقتصادية من 
البيانات. وف هذه الحالة: فمن المتصور أن الشركات سوف تقوم بعملية التنظيم الذاق 
خشية حدوث أضرار بسمعة تلك الشركات أو أن يعبر عملاء الشركات عن عدم رضاهم من 
خلال عدم التعامل مع هذه الشركات إذا انتهكت هذه الشركات خصوصية هؤلاء العملاء 
بشكل مبالغ فيه )2013 „(Minelli et al. 2013; Mayer-Schonberger and Cukier‏ 


أمن البيانات :(Data Security)‏ 
مع وضع قيمة البيانات في الاعتبار. وخاصة البيانات الشخصية التي يمكنها أن تسهل 
سرقة الهوية» أو البيانات التجارية التي يمكن قرصنتها أو استخدامها من أجل تحقيق ميزة 
تنافسية: أصبح أمن البيانات مجالا هاما ف حماية البيانات. فالأفراد يمكنهم فتح العديد 
من الحسابات سواءً الحسابات الشخصية أو حسابات العملء مع العديد من الهيئات 
والبائعين وذلك باستخدام العديد من رموز الهوية الشخصية وأسماء المستخدمين وكلمات 
السر. فالبيانات المتعلقة بهؤلاء الأفراد. والبيانات الشخصية الخاصة بهم» يتم تخزينها في 
الكثير من الأماكن (على سبيل JULI‏ أجهزة الحاسب الآلي. والأجهزة الرقمية: والهواتف 
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USB) ومحركات الأقراص الصلبة الخارجيةء وأجهزة تخزين السانات المتنقلة مثل‎ ASII 
والخوادم. وتكون هذه الحسابات والأجهزة الرقمية عرضة للقرصنة (الدخول على‎ (Drive 
والبرمجيات الخبيثة (الرموز التي يتم تثبيتها بشكل‎ (8588 MI الحسابات أو الوصول إلى‎ 
سري على جهاز الحاسب والتي يمكنها الوصول إلى المعلومات الحساسة أو تسجيل ضغطات‎ 
(الرسائل‎ (Phishing) لوحة المفاتيح وترسل هذه الأشياء إلى طرف ثالث).؛ والانتحال‎ 
الإلكترونية الاحتيالية أو الهندسة الاجتماعية من خلال ال مكالمات الهاتفية التي تحاول أن‎ 

تحعل الشخص ghi‏ ع بتقديم معلومات «(duo‏ مما بودي الى سرقه واختلاس السانات. 
وقد ناقش 2011( (Gantz and Reinsel‏ بالتفصيل خمسة مستويات لأمن «DUI‏ 

وكل مستوى من هذه المستويات له محركات مختلفة إلى حد ماء وذلك على الرغم من أن 

جميع هذه المستويات تتطلب إجراءات أمن استباقية. وهذه المستويات تكون على النحو 

التالي: 

(V)‏ الخصوصية: من أجل المحافظة على المعلومات وتقسد تداولها. 

(Y)‏ الامتثال والالتزام: من أجل حماية البيانات التي من المختمل أن تكون قابلة للكشف 
عند التقاضيء أو الخاضعة لشروط الاستبقاء. 

(Y)‏ الاحتراز: من أجل حماية البيانات التي يمكنها أن تؤدي إلى أو تساعد على سرقة الهوية. 

)€( السرية: من أجل التأكد من حماية ا معلومات السرية مثل الأسرار التجارية. 

)0( التأمينء من أجل حماية المعلومات عالية السرية مثل الصفقات التجارية: وال ملفات 
الشخصية. والسجلات الطبية» وا لمعلومات do S as!‏ التي يمكن أن يكون لها تأثير 
يتجاوز السرقه الشخصية. 
وتعد إدارة المستويات الخمسة السابقة لأمن البيانات مُهمة بالغة الأهمية بالنسبة للأفراد 

والشركات وامؤسسات. وعلى d> g‏ العموم: يتم انجاز هذه ا مهمه من خلال التحكم à‏ الوصول 

عبر برامج الأمن وتصميم النظام / الشبكات ue)‏ سبيل المثال تثبيت جدار ناريء وبرامج 
الخبيثة). والتشفير الذي يتطلب كلمة سر لفتح الملفات المغلقة. وإذا وضعنا في الاعتبار أنه 
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مجرد أن يتم الوصول إلى البيانات فسوف يصبح من السهل نسخها ونشرهاء فإن إدارة الحقوق 
الرقمية تسعى لتقييد مثل هذه الممارسات وأن تجعل من السهل أيضا تتبع تلك الممارسات. 

ومع «US‏ وعلى الرغم من هذه التهديدات» فإن الأجهزة الرقمية والخدمات والبيانات: 
ونقاط الضعف اللمحتملهة ق تهيئتهم» تزيد سرعة أكبر من اللقدرة على تأمينهم Gantz)‏ 
3s (and Reinsel 2011‏ حين أن الكثير من أجهزة الحاسب الشخصية وأجهزة الحاسسب 
المحمولة آمنة بصورة نسبية مادامت برامج الحماية الخاصة بها تحدّث بشكل 48393 
إلا أن أجهزة الحاسب اللوحية: والهواتف المحمولة. وأجهزة الفاكسء ومحركات الأقراص 
الصلبة الخارجية» والأجهزة الطرفية (مثل الطابعات» وأجهزة المسح الضوئء وآلات تصوير 
المستندات الشبكة)ء والعدد الهائل من الأجهزة التي تشكل إنترنت الأشياء عادة ما تتمتع 
بحماية قلبلة )2013 .(Rezendes and Stephenson 2013; Rose‏ وقد sol‏ ذلك ب 
(Mims (2013‏ إلى الادعاء بأنه مجرد وجود أي شيء في بيئة تشتمل على رمز رقمي ويتم 
توصيلة بالشبكة. فيمكن قرصنة هذا الشيء من خلال كائنات يُحتمل أن يتم التحكم بها 
عن بعد أو يتم إجبار ذلك الشيء على تجاوز معايير التصميم» أو العمل بطرق غير مريحة 
أو خطرة: أو يضلل المستخدمين مما يؤدي إلى حدوث الأخطاء والأضرارء أو يتجسس على 
الساكنين أو المستخدمين. وعلاوة على ذلكء. فان الطرق المستخدمة من قبل القراصنة أو 
dai‏ أصحت/أكن iol luis‏ عن السكائق؟ؤأن ضناعة laga al‏ في GL»‏ من 
أجل مواكبة هؤلاء القراصنة وال لحتالين )2012 (Goldberg‏ 

فمع تطور ثورة البيانات» ووفرة ا مزيد من الأجهزة التي تنتج» وتتبادل» وتستخدم 
«SUL UI‏ سدو أن القضايا وا مخاوف الأمنىة معرضة للازدياد ولس التقلص Gantz et al.)‏ 
2007(. وهذا بدوره سيؤدي إلى تفاقم الجرائم مثل سرقة الهوية. وتقوض الثقة (à‏ نظم 
البيانات» ورفع سلسلة من المسائل القانونية المتعلقة بالمسؤولية والالتزامات تجاه حماية 
النظم عندما يتم العبث بالبيانات» واختلاسها وسرقتها )2010 (Weber‏ 
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Profiling, Social) التشخيص. والتصنيف الاجتماعي والخطوط الحمراء‎ 
: (Sorting and Redlining 

بعيدا عن توسيع محيط المراقبةء وانتهاك الخصوصية» ونقاط الضعف المتعلقة بأمن 
البيانات» ab‏ المخاوف بشأن ماهية المجالات التي يتم فيها توظيف فيضان البيانات لتحقيق 
أشياء معينة. وكما أشرنا إلى ذلك ف الفصل السابعء مم تتغير طبيعة البيانات فحسبء ولكن 
يوجد أيضا تحول نوعي في الكيفية التي يتم بها تحليل البيانات» وفي أي الغايات يمكن 
استخدام البيانات وتحليلات البيانات» ومن لديه السلطه لاستخدام واستخلاص القيمة من 
البيانات. فالبيانات كانت تستخدم لوقت طويل من أجل تنميط وتقسيم وإدارة السكانء 
ولكن هذه العمليات أصبحت à‏ الوقت الراهن أكثر dass‏ 4853« وانتشاراء وانتظاما 
عن ذي قبل بكثير. وفي حين أن الهيئات الحكومية تكون ملفات شخصية للأفراد وذلك 
من el‏ أغراض الأمن أؤزصد الاحتيالء إلا أن معظم gaz]‏ في عملية qx anis]‏ من قبل 
الشركات التجارية والتى تسعى إلى فهم واستهداف قاعدة المستهلكين الحالية والمحتملة 
(انظر الفصل (GWI‏ 

ففي الماضيء كانت الشركات تقوم بالتسويق الجماعي» ونشر رسالة dole‏ إلى حد ما 
hwg‏ مجموعة كبيرة جدا من الجمهور وذلك من خلال الإعلان الجماعي باستخدام التلفاز 
والراديوء والطباعةء والبريد الإلكتروني, وذلك من أجل الوضول إلى المجموعة المستهدفة 
لتلك الشركات )2011 .(Schwartz and Solove‏ ومرور الوقت. تم تعزيز هذا الأمر 
من خلال التسويق ال مستهدف وذلك باستخدام التنميط الخام بشكل نسبى. وهناء قامت 
مجموعة صغيرة من الشركات ال متخصصة بتكوين تصنيفات dole‏ للسكان حيث تم تصنيف 
الأسر إلى أصناف ذات ملفات شخصية عامة» والتي كانت في العادة يتم تسميتها من خلال 
اختيار متغيرات ومواقع دهوغرافية» على سبيل JULI‏ باستخدام بيانات الإحصاء aS JI‏ 
أو البيانات التي تعكس أسلوب الحباة كاستخدام بيانات الاشتراكات في دوريات dusza‏ 
على سبيل Juss (Goss 1995) JUXI‏ من محاولة تنميط عملائهم الشخصيين» ترغب 
الشركات في شراء الملفات الشخصية وبانات الاتصال وذلك من أجل تقسيم واستهداف 
أصناف معينة من السكان من خلال رسالة مؤطرة بدقةء وف الوقت نفسه تحقيق الفعالية 
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في ميزانية التسويق من خلال تقليل مصروفات الإعلانات المبددة. وف الآونة الأخيرة, 
بدأت شركات التنميط في إنشاء ملفات شخصية فردية بدلا من الملفات الشخصية العامة 
وذلك من خلال تجميع البيانات من مصادر عدة مثل معاملات البطاقات الائتمانية 
ومعاملات بطاقات c Ll‏ ومسارات النقرء والمشاركات في وسائل التواصل الاجتماعيء 
والعديد من أنواع البيانات الشخصية الأخرى )2013 (Siegel‏ وعلاوة على ذلك» تستفيد 
الشركات ذاتها من الكميات الهائلة من البيانات التى تنشئها عن العملاء على سبيل «JULI‏ 
من خلال المبيعات ومسارات النقر وإدارة علاقات العملاءء وتجميع هذه البيانات مع 
المصادر الأخرى للبيانات وذلك من أجل تكوين الملفات الشخصية الخاصة بهم والاشتراك 
في التسويق السلوى. 

هنا من الناحية الظاهرية: يبدو أن التنميط التنبئي موقف مربح للجميع: للعملاء 
والبائعين: فالعملاء يحصلون على معاملة شخصية ومخصضة: في حين يحصل البائعون على 
مبيعات أكثر ويقللون من النفقات. ولكن وف الممقابلء فإنه هكن استخدام التنميط التنبئي 
من أجل تصنيف الناس من الناحية الاجتماعية واستبعاد فئات منهم من خلال اختيار 
أصناف معينة منهم للحصول على وضع تفضيلي وتهميش واستبعاد الآخرين Graham)‏ 
Leyshon and Thrift 9‏ ; 2005). فعلى سبيل «JULI‏ مكن للشركة تنميط الناس فيما 
يتعلق بمخاطرهم الائتمانية وما هى احتماليه مقدرتهم على الوفاء بسداد مدفوعاتهم 9l‏ 
فيما يتعلق بقيمة حياتهم المتوقعة إذا ما ظلوا في برنامج الولاء وما هي احتمالية تغييرهم 
لعاداتهم )2013 .(Minelli et al.‏ ومن خلال استخدام مثل هذه الملفات الشخصة 
da ass‏ ممكن للشركات تحديد الأولويات لاهتماماتهم ومواردهم» وذلك يتم عادة من 
خلال التركيز على العملاء ذوي القيمة العالية. ومن ثم يتم قياس وتصنيف العملاء بشكل 
منتظم ويحصلون على خدمات تفضيليةء وبعضها يكون تمييزيا مثل استبعاد السكان الذين 
يدون بلا فائدة (لن يحققوا مكاسب للشركة): أو لن يحققوا مكاسب كافية: أو أن المخاطر 
ا مرتبطة بهم dile‏ مما مكن أن يؤثر بدوره على الفرص الحياتية Curry 1997; Danna)‏ 
.(and Gandy 2002; Wyly in press‏ فهذه COL AU‏ الشخصة p‏ منتجات ومكن 
بيعها لشركات أخرى تكون مهتمة في تقييم قيمة ومخاطر العملاء المحتملين» ومن ثم OB‏ 
النتائج السلبية يمكنها أن تطال الشخص عبر الأماكن وعبر الأزمنة. 
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ومثل هذه الممارسات التمييزية يمكن أن تشتمل على تسعير فعال وشخصيء فمن الأمور 
الشائعة بالفعل في سلاسل المتاجر أن تكون السلعة ذاتها مسعرة بطرق مختلفة عر المتاجر 
الملشتلقة وذلك lax ul‏ ال خضائمن وسماث النيكان القن تنو قن هن هده o Ell‏ أو 
أن يكون Ob pew‏ مختلفا وفق الكمية المشتراة (مثلا gl‏ الواحد بدولار o à‏ أن 
الغلاثة متفحات تدولارين): أو أن تهتلف السغار تاختلاف: الجماغات (مثلاً حصول الظلاب 
sl‏ امواطنين الكبار ق السن على تخفيضات) )1996 .(Varian‏ وتتمثل رغبة x‏ من 
الشركات ف تذاول مثل oda‏ الممارسات على Duel‏ فردية» ومعدلة لي تناسب الملفات 
الشخصية. وذلك حتى يدفع آناس مختلفون أسعار مختلفة للمنتج ذاته LS)‏ هي الحال 
مع أسعار تذاكر الطيران ولكن ilo‏ على نموذج مخصص). وتراوح الأسعار أيضا بشكل فعال 
ووفق السياقء بناء على الظروف. وقد بدا بالفعل تطبيق مثل هذه الممارسات الشخصية 
وا مرنة: Le‏ في ذلك قطاع المتاجر. فعلى سبيل JELI‏ تطرق )2012( Clifford‏ إلى أمثلة تبين 
أن المتسوقين يدفعون ف المتجر ذاته أسعار مختلفة للمنتج ذاته وذلك استنادا إلى ملف 
العميل الشخصي. وف بعض الحالات» تقوم المتاجر بتعديل الأسعار وقت تسوق العملاء 
وذلك بناء على موقعهم داخل المتجر وتاريخ التسوق لهؤلاء العملاء حيث يتم منح القسائم 
الإلكترونية في ال موقع عندما agi‏ المتسوقون مسح امنتج باستخدام التطبيقات في هواتفهم 
الخلوية. إن الهدف من وراء التسعير الشخصي والفعال هو الحصول على كامل فائض 
القيمة المتاح في المعاملة وذلك من خلال تسعير البضائع والخدمات لأقرب سعر ممكن 
من السعر الاحتياطي (سعر التحفظ) لدى الفرد )17 :2012 (Tene and Polonetsky‏ 
وبعبارة 5,21« فإن هذا مصمم للاستفادة من الإنفاق (JULI‏ لمصلحة المتجر. 

وبالنظر إلى قدرتهم على تشكيل وتصنيف خبرات ال مستهلكين والفرص الحياتيهء فإن 
الملفات الشخصية للأفراد والبيانات وممارسات البيانات التى تدعمها بحاجة إلى اهتمام أكبر. 
وف الوقت الحالي» فإن كلا من البيانات المستخدمة والتحليلات المطبقة مبهمة وغامضة 
بالنسبة للمستهلكين وا مواطنينء فإذا انتهى الأمر بالشخص مدرجا على قائمة الممنوعين: أو 
تم معاملته بشكل سلبی» أو تم استبعاده من منتج ما من قبل شركة clo‏ على سبيل JULI‏ تم 
وضعه فى القانئمة السوداء للحصول على الائتمان» فمن الصعوبة مكان تحديد الأسس لهذا 
التمييز ومجابهة هذه الأسباب. فالنقاد يدعون بأننا قد ولجنا عصرا حيث: 
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رما يتراءى للبعض أن لبنية البيانات أو الصورة التخيلية للبيانات ميزة وجودية» ولكنها 
Colo Jm‏ رة ra‏ إن La‏ وة doi‏ ناناتك AS] ze‏ فة Bog‏ مما تقول 
أنت عن نفسك. فبنية البيانات هي البنية التى تم الحكم عليك من خلالها في ا مجتمع: 
وهى البنية التي تملي وتفرض وضعك ف العام» فما نشاهده عند هذه الفترة من الزمن هو 
ale‏ التمشل على الكىنونة )1995 (Critical Art Ensemble‏ 

وعلى es JI‏ من ذلك فنحن نعرف أن البيانات الكبيرة وبنية البيانات فوضويان - فهما 
ممتلئان بالثغرات» والمتناقضات والأخطاء (انظر الفصل التاسع) - ونعرف أيضا أن البرامج 
والخوارزميات تعمل بطرق انتقائيه ومتحيزة )2011 (Kitchin and Dodge‏ ومن œ‏ 
فإن الأنظمة التي تعتمد على البيانات الكبيرة. والتي لا تعد شفافة وتفتقد إلى التدقيق 
اللازم وحق الرجوع الملائم» تطرح جميع الأنواع المحتملة من المشاكل وذلك عندما منحون 
الأفضليظة/لبنية البيانات: s‏ الواقع. فإن الوقت Ule euo]‏ الآن el ia A5]‏ 83 مضى 
للرقابة القانونية والتنظيمية على التنميط التنبئي» وعلى الإجراءات التي تشوش على التمييز 
الوجودي للبيانات وتحمي الناس من الممارسات التمييزية والضارة. 


Secondary Uses,) الاستخدامات الثانوية والتحكم في الانسلال والحوكمة الاستباقية‎ 
(Control Creep and Anticipatory Governance 

إن أحد الأسس التي تستند إليها سياسة الخصوصية وحماية البيانات في الاتحاد TOL‏ 
وأمريكا الشمالية هو مفهوم تقليص البيانات. وهذا المفهوم يشترط أن تقوم الهيئات 
والبائعون بإيجاد البيانات الضرورية فحسب لأداء مهمة ماء معنى أن يتم الاحتفاظ 
بالسانات Ub‏ كان ذلك ضروريا لأداء هذة المهمة أو كما تملية الاعتبارات القانونية؛ وأن 
البيانات التي يتم تكوينها يتعين استخدامها فحسب من أجل هذه المهمة Tene and)‏ 
.(Polonetsky 2012‏ ومعنى آخر لا يتعين على جامعي السانات أن يستولوا على آي شىء 
يمكنهم الاستيلاء «ade‏ ولا يتعين عليهم WIS‏ تخزين هذه البيانات Ab‏ غير محدودة أو 
ol‏ يتبحوا هذه البيانات لاستخدامات ثانوية. ومن الواضح أن هذه التطلعات والطموحات 
تتعارض مع المبادئ والأسس المنطقية للبيانات الكبيرة وعمل أسواق البيانات التي تسعى إلى 
تكديس البيانات في حال كان من الممكن أن تكتسب هذه البيانات أي قيمة ف ا لمستقبل: 
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.(Tene and Polonetsky 2012; Andrejevic 2013)‏ فالحل alol‏ البائعين تمثل في إعادة 
تقديم البيانات من خلال إزالة الآجزاء التي تشر لهوية الأفراد من هذه البيانات أو إنشاء 
بيانات مشتقة» مع إخضاع مجموعة البيانات الأساسية فقط لعملية تقليص البيانات. ويمكن 
في هذه الحالة بيع البيانات المعاد تقدهها أو استخدامها بعدة طرقء ومثل هذا الأسلوب 
لإعادة تحديد الغرض من البيانات أمر شائع» حيث يجادل البائعون أنه لا توجد حاجة 
لإبلاغ الشخص الذي تشر إليه البيانات أو الحصول على موافقته» حيث إن هذه البيانات 
مجهولة المصدرء ومشتقة ومجمعة )2007 .(Solove‏ وهذا الحصاد ال محتمل للكميات 
الهائلة من البيانات» والذي تم الحصول على معظمه دون معرفة أو فهم الأشخاصء والذي 
يتم استخدامه بعد ذلك في استخدامات ثانوية» يثير الكثير من الأسئلة الأخلاقية التي لا 
تتعلق بالخصوصية وحماية البيانات فحسب» بل تتعلق كذلك بالحوكمة» ومن الأمثلة 
الواضحة والمتعلقة بالحوكمة هو التحكم ف الانسلال. 

إن التحكم في الانسلال يحدث عندما تكون البيانات التي تم إنشاؤها لشكل من أشكال 
الحوكمة مشتابه لشكل آخر )2001 (Innes‏ وحدث هذا غالبا بشكل شديد الوضوح فيما 
يتعلق بالأمن وخصوصا بعد أحداث الحادي عشر من سبتمبر. حيث تم إعادة توظيف 
البيانات الخاصة بخطوط الطيران والبيانات الإدارية الحكومية من أجل تنميط وتقييم 
مخاطر الأمن للركاب Jes (Lyon 2003b)‏ نحو مشابه» فلقد تم إعادة توظيف كاميرات 
الإشارات المرورية ورسوم الازدحام في لندن من أجل القيام مهام تتعلق بالأمن: وذلك بدلا 
من مراقبة الانتهاكات المرورية فحسب .(Dodge and Kitchin 2007a)‏ ومن الأمثلة 
التجارية على التحكم ف الانسلال هو نظام الملاحة في السيارات المستأجرة حيث يتم إعادة 
توظيف هذا النظام من مساعدة السائقين على إيجاد طريقهم فحسب إلى مراقبه وفرض 
غرامة على هؤلاء الذين يقودون خارج المسار أو يخرجون من الولاية )2004 (Elliott‏ 
فالتحكم في الانسلال يقوض بشكل منهجي الأسباب المنطقية وراء تقليص البيانات» في حين 
أن نشره يشكل تهديدات واضحة للحريات ال مدنية» حيث يكون جميع المواطنين» سواء 
الأبرياء أو المذنبين. خاضعن مراقبته وإجراءاته التأديبية. 
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وهناك مثال آخر على الاستخدام الثانوي للبيانات والذي ينتهك الحريات المدنية آلا 
وهو الحوكمة الاستباقية (التوقعية). وهناء يتم استخدام التحليلات التنبئية من أجل 
تقييم السلوكيات أو الأحداث المستقبلية المحتملة والتوجيه باتخاذ الإجراء المناسب. فمثل 
هذه الحوكمة الاسشاقه m:‏ سمه من سمات السفر بالجو خلال عدد من السنوات» 
حيث يتم تنميط المسافرين من أجل المخاطر والتحقق الأمني وذلك قبل البدء في الرحلة 
bbg .(Dodge and Kitchin 2004)‏ تستخدم العديد من قوات الشرطة ف الولايات 
المتحدة الأمريكية التحليلات التنبئية من أجل توقع موقع الجرائم المستقبلية أو من أجل 
توجيه ضباط الشرطة لزيادة دورياتهم في هذه ال مناطق )2013 51685»1). وعلى النحو «l3‏ 
تستخدم بعض الشركات مثل هيوليت باكارد (Hewlett Packard)‏ التحليلات التنبئيه من 
أجل تقييم ومعرفة مَنْ من الموظفين من المحتمل أن يغادر الشركة ومن ثم التدخل بشكل 
استباقي فين UST‏ تقليل نفقات استبدال الموظفين )2013 (Siegel‏ وق مثل هذه الحالات» 
فإن آثار البيانات الخاصة بالشخص تقوم ها هو أكثر من تتبع الأشخاصء إذ تقوم باستباق 
هؤلاء الأشخاص )2002 (Stalder‏ 

إن مثل هذه الأساليب من الحوكمة تفرض قضايا أخلاقية بسبب أنها توجه الاهتمام 
إلى مجموعات وأماكن dius‏ وهي كذلك تسعى لراقبة السلوكيات التي رها لن تحدث 
على الإطلاق. وخلال هذه العمليةء كما تقوم بإعادة تشكيل كيف يكن للناس العمل من 
خلال الانضباط الذاق )2006 (Harcourt‏ وعلاوة على ذلك: فإن مثل هذه التحليلات 
التنبئية تعمل في غالب الأحيان على تفاقم التحامل والتمييزء وتعمل كذلك على تأسيس 
النبوءات ال محققة لذاتها (التوجه نحو إشباع الذات) )2013 (Harcourt 2006; Siegel‏ 
ومن ثم فلقد ادعی 128 :2013( :(Raley‏ "إن البيانات في هذا المجال تكون آدائرة: فتجميع 
أجزاء وبتات (bits)‏ من البيانات في ملفات شخصية لمشتبه به ف الإرهاب» وإعادة تأسيس 
البيانات المجردة عند استهداف حياة واقعية سوف يكون لهما تأثير على إنتاج هذه الحياة 
هذا الشخص,» كمشتبه به بالإرهاب بالفعل". ومن ثم يتم وضع الفرد تحت بؤرة المراقبة 
وممارسات مراقبة الدولة. وجعله NETS‏ لنتائج وتداعيات 439$ lis‏ به بالارهابء. على 
الرغم من عدم التيقن من هذا الاشتباه. وبعبارة 5,2« تتم معاملة الشخص بطريقة 
مختلفة من جراء التوقع بأنه رها يكون شيئا ماء في حين أنه رها يُكن هذا الشيء 3l‏ 
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a So Y‏ أو رما يرتكب هذا الفعل أو لا يرتكبه. وفي حين أن النوايا وراء هذا العمل 
رما تكون نوايا عظيمة وحسنة» إلا أن التوقع في هذه الحالة له تداعيات تتجاوز gie‏ 
الأحداث امتوقعة )2006 .(Harcourt‏ وكما هو الحال مع الأشكال الأخرى من التنميط: 
فإن الحوكمة التنبئية يتم توجيهها بشكل كبير من خلال خوارزميات الصندوق الأسود التي 
تعمل على بيانات ذات أصل غير معروف» وهي على وجه العموم منغلقة على حق الرجوع 
(النقد). فالحوكمة التنبئية كانت مثار القليل للغاية من الاهتمام النقدي أو ال مناقشات 
وذلك ها يتعلق بتأثيراتهاء وعلى الرغم من ذلك تم تطويرها بفعالية من أجل استخدامها 
في الحكومات والشركات. 


Modes of Governance and) أساليب الحوكمة والضوابط التقنية‎ 
:(Technological Lock-Ins 

بعيدا عن التحكم في الانسلال والتنميط التنبئيء فإن ثورة البيانات لها تأثيرات محتملة 
فيما يتعلق بتنظيم وتشغيل الحوكمة. وإذا وضعنا في الاعتبار الشبكة المتسعة لجمع 
البيانات» وقراراتها الدقيقة: فإن قلق الكثير من المعلقين ينبع من أن عصر ظهور البيانات 
ôu SII‏ يسبق pas‏ ظهور ما أصطلح على تسمىته dilog‏ الأخ .(Big Brother) „SY‏ وهذا 
يعني أننا في عصر أضحت فيه الدولة وا مؤسسات تعرف وتتوقع الكثير جدا عن الأفراد من 
خلال مراقبة البيانات والتنميط التنبئي لدرجة أنهم يمتلكون السلطة لفرض أشكال قاسية 
وضارة من التحكم الانضباطي. 

وكما آشرنا إلى ذلك خلال هذا الفصلء فنحن نعيش وبدون شك 3( عصر المراقبة الزائدة 
بشكل مبالغ فيه. حيث أصبحت اللراقبة أكثر اتصالا من أي وقت «she‏ وهي مدعومة من 
خلال تزايد ثقافة السيطرة التي ترغب في الأمنء والاستقرار وتقليل المخاطر )2007 (Lyon‏ 
وهناء يتم تشريع نوع جديد من الحوكمة. وهو نوع يؤول فيه تنظيم جوانب معينة 
من الحياة sss JI‏ إلى الأنظمة التقنية ا مملوءة بالتوكيل الثانوى Kitchin and Dodge)‏ 
1. فعلى سبيل JELI‏ فإن معرفةء ومعالجة وإدارة الانتهاكات المرورية تتم بشكل 
متزايد من خلال الأنظمة الآليةء والمسموح بها من خلال برنامج يقوم بمعالجة البيانات التي 
تتعلق بأرقام اللوحات» والسرعةء وحق الوصولء وإحالة هذه البيانات إلى قواعد بيانات 
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الملكية من أجل فرض غرامات أو خصم blä‏ بشكل (Dodge and Kitchin 2007a) î‏ 
وعلى النقيض من الأشكال التقليدية من المراقبة التي تسعى إلى تشجيع الانضباط الذاق» 
فإن الأنظمة الالية تقوم بإعادة تشكيل السلوك بشكل فاعل Agre 1994; Kitchin and)‏ 
(Dodge 2011‏ وق مثل هذه الأنظمة. l8‏ آليات إنشاء البيانات وتنظيمها تعتير yas‏ 
مهما للغاية من النظام» وذلك بدلا من كونها les‏ خارجا عن النظام. فعلى سبيل المثالء 
بدلا من أن يقوم عمال صناديق المحاسبة بإجراء الانضباط الذاق معدل عملهم لأنهم رها 
أو رما لا يعرفون أنه تتم مراقبتهم من خلال كاميرات المراقبة التلفزيونية ذات الدائرة 
المغلقة»ء فإن عمل مسح البضائع ومعالجة المدفوعات هي الوسائل التي يتم من خلالها 
مراقبة معدل العمل بشكل مستمر. وف مثل هذه الأنظمة/ فإن امراقبة وآثار البيانات 
المرتبطة بهذه المراقبة أصبحت مستمرة: ومتغلغلة. ومواظبة» ومتفاعلةء مع سلوك الخاضع 
لها ولكنها تقع خارج سيطرته )2012 (Cohen‏ 

إن البيانات التي تكونت بشكل آلي لا يستخدم جميعها من أجل تشريع الإدارة الآلية 
ولكن هذا هو الاتجاه السائد بشكل متزايد» وخاصة للأنظمة عالية التنظيم. وعلاوة على 
«SS‏ فإن الأساليب الجديدة من التحكم» إلى الآن» لا يتم السماح بها بالطريقة الصارمة 
التي توقعتها رؤية جورج أورويل (George Orwell)‏ في روايته "الأخ الأكبر". فهذه 
الأساليب عادية وروتينية ومغرية وتشجع المواطنين على أن يشاركوا بفعالية وبتلقائية 
à‏ ممارساتها )2012 .(Kitchin and Dodge 2011; Cohen‏ ونتيجة لذلكء فإنه وكما 
ذكر )2007( Solovo‏ فإن البيانات الكبيرة لا تتعلق بشكل كبير مباشرة )43 جورج 
أورويل ولكنها ترتبط بشكل أكبر برؤية كافكا (Kafka)‏ كونها تطرح قضايا عن الإجراءات 
الواجب اتخاذها فيما يتعلق باللامالاةء الأخطاءء الانتهاكات» الإحباط نقص الشفافية, 
والاستعانة أكثر مما تطرحه عن التسلط والاستبداد. وعلى النقيض من ذلك فبالنسبة ها 
قاله )2013( .Boellstroff‏ فإن المجاز الأساسي في البيانات الكبيرة والمراقبة ليس الرؤية 
الكليةء ولكن بالأحرى هو التسليم» فبدلاً من أن يكون الفرد خاضعاً على نحو صرف لرقابة 
انتهاكية» يُسلم الناس بحماس ببياناتهم من خلال وسائل التواصل الاجتماعي» أو من خلال 
الانضمام في برامج بطاقات الولاء... إلخ. وبغض النظر عن الصياغة التصورية للعملية: 
فمن الواضح أن هذه الأنظمة الجديدة لها تأثيرات فيما يتعلق بالسلطة والسيطرة: وتقوم 
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بتشكيل التجارب والفرص الحياتية بطريقة مختلفةء وأن دور البيانات ومراقبة البيانات في 
مثل هذه الآنظمة يتطلب اهتماما نقديا إضافيا. 


إن من الطرق التي يتم من خلالها تحويل الحوكمة من قبل التقنيات التي تدعمها 
البيانات أن نجعل الحوكمة أكثر تكنوقراطية بطبيعتها (معتمدة على التقنية بشكل (AS‏ 
فعلى سبيل «JULI‏ فإن النزعة تجاه إدارة وتنظيم المدن من خلال أنظمة ال معلومات 
والأنظمة التحليلية تعزز الأسلوب التكنوقراطي للحوكمة المدنية التي تفترض أنه من 
الممكن قياس ومراقبة جميع المجالات المدينة ومعاملة هذه المجالات على أنها مشاكل فنية 
يمكن التعامل معها ومجابهتها من خلال الحلول الفنية )2014 (Kitchin‏ وهي توضح ما 
أطلق عليه )2013( Mattern‏ مصطلح "العقلانية الأدائية". وما أطلق عليه Morozov)‏ 
2013( "مقاربة الحلول التقنية" حيث مكن تجزئة المواقف الاجتماعية المعقدة إلى مشاكل 
محددة بشكل دقيق تمكن حلها أو البحث عن أفضل الحلول لها من خلال الحوسبة. 
ومرة أخرى» فإن هذا يعد تجسيدا للبيانات الكبيرة حيث هكنها أن توفر إجابات لجميع 
المشاكل )2013 (Mattern‏ ومن خلال التقاط وتمثيل الظواهر كبيانات بشكل آن أو 
لحظيء يصبح من الممكن من الناحية الظاهرية تخطيطء وفهم» وإدارة» وإصلاح الموقف 
أو المشكلة حال حدوثها. وقد أوضح )2013( Hill‏ آن "تفكير المدينة الذكية" ينم عن 
وجهة نظر تكنوقراظية ob‏ المدينة هي شيء يتعين علينا فهمه بالتفصيل كالمحرك أو 
محطة الطاقة النووية وذلك في حال كان لدينا بيانات كافية فقط. وأنه تبعا لذلك سيمكننا 
السيطرة على هذه المدينة من خلال القوة الغاشمة للعلم والهندسة. وف الواقع: فقد اقترح 
Matten (2013)‏ أن تحضر البيانات الكبيرة يعاني من تراكم البيانات» وهو افتراض أن جميع 
التدفقات والأنشطة الهادفة مكن الإاحساس بها وقياسها. وداخل مثل هذا التفكير هناك 
افتراض واضح في الغالب وهو أن الكون تشكل من قبل المعايير القابلة للمعرفة والقابلة 
للتحديد والتي تؤكد LJ‏ أنه لو كان بإمكاننا قياس جميع هذه ال معاييره فسوف نكون قادرين 
على التنبؤ والاستجابة بتمكن تام وفقا لذلك )2012 (Haque‏ وعلى الرغم من «US‏ لن 
يكون بمقدور الحلول التقنية بذاتها حل المشاكل الهيكلية المتأصلة في المدن OY‏ هذه الحلول 
لا تتعامل مع أسباب تأصل تلك المشاكل. ولكن بدلا من ذلك فإن هذه الحلول تمكن فقط 
من إدارة مظاهر تلك المشاكل بشكل أكثر فعالية. وفي حين أن تقنيات المدن الذكية مثل 
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أساليب التحليل اللحظية والآنية يتم الدفع بها كوصفة للتعامل مع جميع قضايا الحوكمة 
المدنية: إلا أن هذه التقنيات في الغالب الأعم تداري الشقوق بدلا من إصلاحهاء إلا ISI‏ 
واكب هذه التقنيات مجموعة أخرى من السياسات )2014 .(Kitchin‏ ومكن أن ينطبق 
الأمر نفسه على الطرق التكنوقراطية المطبقة ف بعض المجالات الأخرىء فأساليب الحوكمة 
التي تقودها البيانات تضمن بالفعل تنفيذ إستراتيجيات مدعومة بالأسانيد ولكن يجب أن 
تكون مقترنة بالسياقء ومرنة» ومستهدفة بشكل ملائم» ولا يتم إدارتها ببساطة من خلال 
الأرقام والخوارزميات. 
ويتزامن مع ذلك الانتقاد القائل أن الحوكمة أصبحت مبنية على معرفة تامة وتكنوقراطية 
مفرطة ومع الخوف من أن يتم الاستيلاء عليها وتشكيلها بشكل صريح من قبل مصالح 
الشركات من أجل تحقيق مكاسب شخصية. وبالعودة إلى JULI‏ المتعلق ببرنامج المدينة 
الذكية ومثال الحوكمة البلديةء وكما أشرنا إلى ذلك في الفضل السابع فإن عددا من أكبر 
شركات خدمات البرامج والأجهزة يسعى بشكل فعال إلى التعاقد من الباظن غلى مجالات 
من الإدارة المدنية dlg‏ تجعل من بضاعتهم جزءًا Y‏ يتجزاً وذات دور جوهري في كيفية 
مراقبة وتنظيم العديد من مجالات الحياة ق المدينة )2013 (Kitchin 2014; Townsend‏ 
إن الهاجس والقلق النابع من خصخصة الإدارة المدنية ذو ثلاثة أوجه )2014 (Kitchin‏ 
ه أولاً: أنه يعزز بشكل فعال الاقتصاد السياسي للليبرالية الجديدة والتحول نحو اقتصاد 
السوق في القطاع العام حيث يتم إدارة وظائف المدينة من أجل تحقيق الربح 
الخاص )2008 .(Hollands‏ 
ib.‏ أنه يؤسس للقيد التقني الذي يجعل المدن مدينة وممنونة بالفضل لمنصات ومزودي 
خدمات تقنية معينة خلال مدة زمنية طويلة: مما يخلق مواقف احتكارية )2013 (Hill‏ 
والخطر في هذه الحالة يكمن في تأسيس تبعية للمسار المؤسسي مما لا يمكن إلغاؤه أو 
التحول عنه بسهولة )2012 (Bates‏ 
ه ثالثا: أنه يؤدي إلى حلول مغلفة أساسها "نظام واحد مناسب لجميع المدن الذكية" والتى 
لا تضع في اعتبارها إلا بشكل ضثيل للغاية خصوصية وتفرد الأماكنء والناسء والثقافات» 
وتقيد إدارة المدينة على أسلوب تكنوقراطي ذي رؤية ضيقة للحوكمة )2013 (Townsend‏ 
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وإذا ما أستحضرنا الواقع: فإن شركة IBM‏ ف الوقت الحال منتجاً يسمى "مركز عمليات 
IBM‏ الذي" الذي يجمع العديد من الأنظمة التي تم تصميمها لمدينة ريو دي جانيرو قي 
منتج واحد يمكن تطبيقه على أي مدينة Singer 2012c)‏ انظر الفصل السابع). ولا يعني 
هذا أن نقول إن القيود التي تفرضها الشركات أمر حتمي» ولكن من الواضح أن ذلك يمثل 
رغبة عدد من أكبر الشركات العاملة في هذا المجال. وبالمثل» يتم استهداف أشكال أخرى 
من الحوكمة بشكل متزايد من خلال الشركات التي تسعى إلى إيجاد أسواق للحلول التقنية. 
ومرة أخرىء فإن تداعيات مثل هذه الأشكال من الحوكمة تتطلب الكثير من التدقيق. 


الخاتمة: 

ناقش هذا الفصل التداعيات الأخلاقيةء والاجتماعية. «d. Lula‏ والقانونية للتغييرات 
التى تحدث من جراء تكوين البيانات ودمج البيانات واستخدام البيانات.. ومن الواضح 
أنه في حين أن مثل هذه الممارسات لها فوائد بالنسبة للحكومات والشركات وال مواطنين. 
إلا Gil‏ في الوقت نفسه لها تداعيات سلبية وتمييزية. وإذا وضعنا في الاعتبار السرعة التي 
xs‏ بها مشهد السيانات» فإن مواكبة التطورات وتحديد الآثار المحتملة لهذه التطورات» 
ودراسة ردود الفعل الاجتماعية والقانونية المناسبة يعتبر تحديًا هائلا. وف الواقع هناك 
الكثير من الأسئلة الأساسية المعيارية التي تتطلب دراسة تأملية والتي تتعلق من يمكنه 
تكوين مجموعات البيانات والوصول إليها ومشاركتها وتحليلهاء ولأي غرض وفي أي سياق 
وتحت أي معوقات أو قبود )673 :2012 .(boyd and Crawford‏ إن الحاجة إلى إجابات 
لمشل هذه الأسئلة pol‏ ملح وذلك إذا وضعنا في الاعتبار المدى والتأثيرات المترتبة على 
مراقبة البيانات وانتهاك الخصوصية والأمن غير المحكم للبيانات» والتأثيرات الضارة للفرز 
الاجتماعي والاستبعاد. والطبيعة والأساليب المتغيرة للحوكمة. فحتى لو كانت الاستجابة 
سريعة ومبالغ فيهاء فإن الإجابات المترتبة ستكون متنوعة» حيث إن العديد من أصحاب 
المصلحة يسعون وراء إستراتيجيات بديلة من أجل التعامل مع المخاوف العديدةء بحسب ما 
يتضح من خلال المناهج المقترحة لتفتت وانتهاكات الخصوصية. ونتيجة لذلك» يمكن للمرء 
ol‏ يتوقع الكثير من ا مناقشات ف السنوات القادمة فيما يتعلق بإدارة العناصر العديدة 
في ثورة البيانات. وعلى وجه الخصوص. وكما ناقشنا في الفصل الثاني» فإنه من ا لمحتمل أن 
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يوضع عمل سماسرة البيانات تحت التدقيق المتزايد سواء من جانب الحكومة أو المواطنين. 

ومن منظور 3851" « من ال مهم للغاية أن يضطلع العلماء بدور فاعل في استقصاء ودراسة 
القضايا القانونية والسياسية والاجتماعية والأخلاقية التي تنشاً نتيجة لثورة البيانات» مع 
التتبع والإسهام في المناقشات العديدة المستمرة. يحتاج مثل هذا العمل إلى أن يشتمل من 
جانب على دراسات حالة تجريسة مفصلة توثق التأثرات المادية والاستطرادية الناتجة عن 
كيفية توظيف البيانات» ومن جانب آخر على البحوث والرسائل المعيارية والشاملة التي 
تحدد تأثيرات تجميع العديد من البيانات والطرق البديلة الممكنة. وحتى هذه اللحظة 
فإن معظم الإسهامات كهذا الفصل والأعمال التي يناقشها تكونت من الجانب الأخير مع 
352-5 القليل ce la‏ الدزاستات duo yx‏ غل فض 'الأنظمة اللمتباعنة القدية جد ةة 
ونتائج هذه الدراسات. إن مثل هذه الدراسات مهمة للغاية لأنها تكشف الطرق ال ملموسة 
التي تم من خلالها تقديم مبررات لتجميع البيانات» وكذلك اللهام التي يتم ممارستها وكيف 
يتم قبولهاء وإعادة تنقيحهاء ومقاومتهاء وإفسادهاء وانتهاكها من قبل المجتمعات» وهذه 
الدراسات توفر أيضا قاعدة أدلة يتم من خلالها تصور كيف هكن إعادة تأطير مثل هذه 
الأنظمة أو إعادة تحديد الغرض منها. 
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الفصل الحادي عشر: فهم ثورة البيانات 


(Making Sense of the Data Revolution) 


ناقش هذا الكتاب قضية أنه يتعين أن تكون هناك حاجة إلى تعاط أكثر نقدية وفلسفية 
مع البيانات وأن ثورة البيانات ما زالت EB‏ في الوقت الراهن. وفيما يتعلق بالأمر الأول 
ادعى البعض أن البيانات تمثل عناصر أساسية لإنتاج المعرفة. ومع ذلكء فحتى الوقت 
الراهن لم تحظ الصياغة الوجودية للبيانات والمجاميع المحيطة بإنتاج البيانات واستخدامها 
بالاهتمام الكاني. وبدلا من ذلكء فإن التركيز كان منهجيا بصورة أكبر فيما يتعلق بتكوين 
البيانات: أو أن التركيز كان على الأشكال الاشتقاقية للمعلومات والمعارف: وفيما يتعلق 
بالأمر الثاني ادعى البعض أن تدرج البيانات الصغيرة ف البنى التحتية للبيانات وإتاحة 
الوصول للبيانات التي كان الوصول إليها محدودا في السابق. وظاهرة البيانات الكبيرة 
تدمر الابتكارات ولا تدعمها أو تحافظ عليهاء فهي تغير طبيعة البيانات من حيث حجم 
هذه البيانات» وسرعتهاء وشموليتهاء وعلاتقيتها ودلاليتهاء ومرونتها وتوسعهاء وتنوعهاء 
وانفتاحها وتبادليتهاء وهى السبب في ظهور مجاميع بيانات جديدة وطرق جديدة لفهم 
العام الذي نعيش فيه. إن التأثيرات التدميرية لثورة البيانات لها تداعيات هائلة على 
الحكومات والشركات والمجتمع المدني وذلك من خلال إنشائها لمعارف وممارسات جديدة 
يمكن استخدامها من أجل إعادة صياغة كيف يمكن أن يتم حكم الناس» وكيف يمكن أن 
تتم إدارة المنظمات» وكيف يمكن أن تتم زيادة القيمة والفائدة» وكيف هكن أن يتم تكوين 
رأس «JUI‏ وكيف يمكن أن يتم تحسين الأماكنء وكيف يكن أن تتم إعادة تخطيط وممارسة 
العلم. وهي أيضا أثارت العديد من التحديات وطرحت الكثير من الأسئلة» ومكنت لوسائل 
أكثر شيوعا فيما يتعلق بمراقبة البيانات» وتقويض الخصوصية: وتنميط الأشخاص والأماكن 
والفرز الاجتماعي» ومهدت لسن أشكال جديدة من الحوكمة. فهذا الفصل الأخير يحدد 
خطة طريق دلالية من أجل إدراك وفهم البيانات وثورة البيانات وذلك بالنظر إلى الفجوات 
الحالية في الفكر المفاهيمي والمعرفة. ويشير هذا الفصل إلى أن مثل هذا الفهم بحاجة 
إلى أن يحدث بطريقتين: 991« من خلال التفكير الفلسفي الشامل والتحليل النقدي 
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والمفاهيمي. والثانية. من خلال البحوث التجريبية المفصلة التي تتعلق «Job‏ وتشكيلء 
ووظيفية وتطور مجاميع البيانات. 


فهم السانات وتورة السانات (Understanding Data and the Data Revolution)‏ : 
إذا وضعنا في الاعتبار فائدة وقيمة البيانات» فهناك حاجة ملحة للنظر إليهم من وجهة 
النظر الفلسفية وا مفاهيمية. فالفلسفة»ء كما ادعى )1921( «Wittgenstein‏ هى التوضيح 
ا منطقي للفكر. فكل مدرسة من مدارس الفكر تخد نظاما للأفكار lalia‏ لفهم العام. 
ومصطلح cele‏ تتشكل JS‏ مدرسة وتختلف عن المدارس الأخرى من خلال أربعة مكونات 
-الوجودية (Ontology)‏ والمعرفية (Epistemology)‏ والأيدلوجية (Ideology)‏ 
والمنهجية (Methodology)‏ - وهذه المكونات هي التي تحدد معاييرها. فالوجودية هي 
مجموعة من ال معتقدات التي تتعلق بطبيعة الوجود. وهي تهتم le‏ هو موجود وما مكن 
ملاحظته ومعرفته. وبالنسبة للبيانات» فالوجودية تتعلق بماهية البيانات. ما الطبيعة 
الأساسية للبيانات؟ أما المعرفية فهي تتعلق بكيفية استخلاص المعرفة أو الوصول إليها. 
وهي الافتراضات عن كيف هكننا معرفة العام بمعنى كيف أصبح بإمكاننا معرفة البيانات؟ 
وهي أيضا تتعلق بكيفية حشد البيانات في ممارسة التعلم. أما الأيدلوجية فهي تتعلق 
بالسياسات الضمنية والغرض من إنتاج المعرفة» وال مدى الذي يسعى من خلاله ال منهج لي 
يكون محايدا معنى أن يكون موضوعيًا وغير تقويميء أو المدى الذي يسعى من خلاله 
المنهج بفعالية للتدخل وتغيير العالم. وحيث CUS‏ ينطوي تحت مفهوم الأيدولوجية العديد 
من الأسئلة مثل هل البيانات سابقة للحقيقة؟ وهل هي سابقة للتحليل وبلاغية؟ أو هل 
البيانات اجتماعية el‏ سياسية؟ وهل تمت صياغة هذه البيانات بفعالية؟ أما المنهجية 
فهي مجموعة الإجراءات المستخدمة من أجل تفعيل سؤال أو نظرية ضمن الافتراضات 
الوجودية أو المعرفية للفلسفة الإجمالية للبحث. وهي تشكل اختيار الأساليب التي يتم 
من خلالها تكوين وتحليل البيانات» فالمنهجية والأساليب مرتبطان بشكل وثيقء ولكن ما 
طبيعة هذه العلاقة سنهما؟ 
لقد شرع الفصل الأول في تقديم إجابات أولية عن هذه الأسئلة وقدم أيضا صياغة لفهم 
البيانات من منظور فلس في مكن من فصل هذه البيانات عن كونها مجرد "مواد خاء" 
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للمعلومات والمعارف. فالبعض ادعى أن البيانات اجتماعية ومادية: وأن البيانات لا تمثل 
العام فحسب» ولكنها تنتج هذا العالم بشكل فعال. وادعى البعض أيضا أن البيانات لا توجد 
بشكل مستقل عن الأفكار» والأساليبء والتقنيات» والناس» والسياقات التي تنتج» وتعالج: 
وتديرء وتحللء وتخزن هذه البيانات. وق الواقع: يتم تنظيم البيانات وتخزينها في قواعد 
البيانات والبنى التحتية للبيانات التي تشكل لب المجاميع الاجتماعية الفنية المعقدة. وكما 
تم الإشارة إليه بالتفصيل ف الفصل الأول تشتمل هذه الأنظمة على أنظمة الفكرء وأشكال 
المعرفة: والتمويلء والاقتصاد السياسيء وأنماط الحاكمية. والتشريعات» والماديات» والبنى 
التحتية: والممارسات: وال منظمات وال مؤسسات,. والذاتيات والمجتمعاتء والأماكن والأسواق»: 
وكل نظام من هذه الأنظمة يشتمل على عناصر عديدة (انظر الجدول .)١ - Y‏ فهذه 
العناصر تعمل سويا بطرق متعددة: واتفاقية وارتباطية وذلك من أجل الإنتاج الاستطرادي 
والمادي مجاميع البيانات (انظر الشكل .)١ - Y‏ لقد تم عبر هذا الكتاب مناقشة العديد من 
هذه المجاميع مثل البنى التحتية البحثيةء والمحفوظات الوطنية» والبنى التحتية السيبرانية: 
ومشروعات البيانات المفتوحة» وسماسرة LLI‏ وأنظمة البيانات الحكومية» وأنظمة 
الأعمال. وكل واحدة من هذه المجاميع» بالرغم من أنها تتشارك في قواسم مشتركة. إلا Lol‏ 
تتطور وتعمل بطرق مختلفة» وهي تتكون من مجموعة من الأنظمة والعناصر التي تتوسع 
بشكل مختلف ue)‏ سبيل JULI‏ من المنظمات. والماديات ال محلية. إلى الفرق امنتشرة. 
والقوانين الوطنية. وفوق الوطنية إلى الأسواق العامية) ولكنها على الرغم من ذلك مرتبطة 
داخل 44595 فريدة. 

إن مثل هذه الصياغة تمكننا من جهة من التفكير في إنتاج البيانات وكيف يمكن صياغة 
هذه البيانات بأشكال متعددة من النواحي الفنية. والسياسيةء والاقتصادية» والأخلاقية, 
والمكانية: والزمانية» وصياغة استخدامات هذه البيانات والعمل الذي تقوم به (à‏ العام 
وتمكننا من الجهة الأخرى. من توجيه البحوث التجريبية التي تتعلق بمجاميع البيانات 
(انظر الجزء التالي). وهيء على الرغم من EUS‏ مجرد مجموعة واحدة من الطرق ال محتملة 
لفهم البيانات» ومما لا شك فيه أنه بمرور الوقت سيتمكن العلماء من إنتاج مجموعة 
من المناظير التي يمكننا من خلالها فهم البيانات. إن تنوع وجهات النظر سوف يؤسس 
لعناصر تكميلية مثمرة للآفكار الجديدة ووجهات النظر المفاهيمية من أجل توجيه البحوث 
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التجريبية. وربما تشتمل هذه على تنظير البيانات من خلال منظار تأسيسي (بنيوي) أكبر 
يركز على دور هذه البيانات في تشغيل الرأسمالية المتأخرة: أو يستفيد من مفاهيم ما بعد 
البنيوية لدولوز (أحد eal‏ الفلاسفة الفرنسيين في النصف الثاني من القرن العشرين) التي 
تتعلق بأساليب الحوكمة الجذمورية (الجذمور: مفاهيم تتوزع على شبكة» بحيث تلتقي 
مع بعضها دون اشتراط اللزوم)ء أو الانتقادات النسائية ما بعد الاستعمار للنوع الاجتماعي 
والإنتاج المسَيّس وتوظيف البيانات. وبغض النظر عن المنظور, فا لمطلوب هو تفكير عميق. 
وحريص ونقدي مع تنظير العمل من خلال دراسات الحالة التجريبية. 

إننا لسنا بحاجة إلى استكشاف الصياغات المفاهيمية للبيانات فحسب» ولكننا بحاجة: 
كما ناقشنا في الفصل الثامنء إلى دراسة كيف تطرح ثورة البيانات بعض التحديات أمام 
الفلسفات الحالية للعلوم. فالبيانات الكبيرة وتحليلات البيانات توفرء على وجه الخصوص› 
إمكانية ظهور نموذج علمي جديد. آي نهج معرفي جديد يتميز بكثافة البيانات ويتسم 
بالاستكشافية بطبيعته وذلك من أجل تطوير النظرية العلمية: فالمحاولات الأولية للتفكير 
فيماممكن أن يعنيه مثل هذا التحول النموذجي كانت ف غالب الأحيان مرتبكة Alla‏ 
وتعزز شكلا من أشكال التجريبية التي يجدها الكثير من العلماء إبعادية وخطوة إلى الخلف 
وليست خطوة إلى الأمام. ويتعين استبدال هذا بمنظور أكثر فعالية لما يمكن أن يتكون 
منه العلم المساق بالبيانات من حيث معتقداتة الفلسفية والمنهجية. لقد بدأ مثل هذا 
التفكير بالكادء ومع ذلك فهناك حاجة ملحة إليه من أجل مواكبة إيقاع التغير التقني ونشر 
المنهجيات المخصصة والبراجماتية (الواقعية)ء وكذلك من أجل استبدال الأشكال التجرسية 
الضعيفة المنتشرة. فالتحول النموذجي أقل احتمالية في العلوم الإنسانية والاجتماعيةء ولكن 
على es JI‏ من البيانات الكبيرة» فإن البيانات المفتوحة والبنى التحتية للبيانات توفر منهجيات 
وطرق جديدة للقضايا الاجتماعية» والثقافيةء والسياسية»ء والاقتصادية» والتاريخية. فالفصل 
الثامن استعرض خطة تفصيلية LI bL‏ والانتقادات النسبية المتعلقة بالعلوم الإنسانية 
الرقمية والعلوم الاجتماعية الحسابية التي يتم تطويرهاء ولكن هناك حاجة ملحة لمناقشات 
كاملة وصريحة من شأنها استخراج النتائج من التحول المعرفي ف الفكر والممارسة. ويجب أن 
تقوم مثل هذه المناقشات أيضا بتقييم دور ومزايا دراسات البيانات الصغيرة» وكذلك المناهج 
الهجينة التي تمزج أساليب ووسائل البيانات الصغيرة والبيانات الكبيرة. 
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ومثل هذا التفكير يجب أن يواكبه تفكير آخرء موجه بشكل أكبر تجاه المعيارية» في 
تكوين واستخدامات البيانات» وإنشاء وتشغيل مجاميع البيانات. وكما ناقشنا في الفصل 
العاشرء تطرح ثورة البيانات عددا من القضايا الشائكة وذلك فيما يتعلق بالمدى الذي يتم 
على أساسه التقاط الحياة اليومية في مجاميع البيانات» وكيف أن بنية البيانات للناس تفوق 
وتضع قيودا على حياتهم بجميع أنواع الطرق غير المتوقعة. فعلى سبيل JÈL‏ هل يجب 
أن يتحلى الناس بالمقدرة على الوصول إلى جميع البيانات المتعلقة بهم» olg‏ يكون لديهم 
الحق في تصحيح والاعتراض على هذه البيانات» أو تحليلات البيانات أو التنميط؟ وإلى أي 
مدى يجب أن يكون الناس قادرين على ممارسة الحق في أن يتم نسيانهم؟ وما هي الطرق 
التى يمكن من خلالها إخضاع سماسرة البيانات لرقابة وتنظيم مستقلينء وخاصة عندما 
تكون بياناتهم وخوارزمياتهم تؤثر في الفرص الحياتية للناس؟ وما هو مدى تأمين الأنواع 
المختلفة من البيانات ؟ وما العقوبات المحتملة على انتهاكات هذا التأمين؟ وما الحدود 
ا مشروعة للحكومات في تجميع ودمج البيانات عن مواطني هذه الحكومات؟ si dla‏ مدى 
مكن إشراك المؤسسات ف أعمال الحكومات وأنظمة الحوكمة؟ فهذه القضايا تتعلق iale‏ 
المجتمع المرغوب فيه في عصر وفرة البيانات» والإجابات عن هذه الأسئلة لها تداعيات 
وخاصة فيما يتعلق بإمكانية إعادة تصور وإعادة تهيئة مجاميع البيانات» وهذا يشمل 
الأشكال الجديدة من الحوكمة والتنظيم. فالعلماء القانونيون بدئوا بالفعل في التفكير في 
بعض القضايا مثل نتائج خصوصية البيانات الكبيرةء وبدؤوا كذلك في تقديم طرق بديلة 
للتعامل مع أكثر الآثار ضرراء ولكن من الواضح أن مثل هذه القضايا بعيدة كل البعد عن 
الحل» وآنها ستكون محل تركيز المناقشات المتطورة والصراعات التشريعية: وأن هناك حاجة 
ملحة للإسهام في هذا الحوار الفعال والصريح والمستمر. 

ويتزامن مع تطوير فهم مفاهيمي ومعياري أعمق وأفضل OLLU‏ الحاجة إلى توفير 
وجهات نظر شاملة نقدية وكلية عن البنى التحتية OLLU‏ واسانات ال مفتوحة والسيانات 
الكبيرة وتداعياتهم. لقد قدم هذا الكتاب تحليلا شاملا بدلا من طرح فرضية تستند إلى 
بحث تجريبي شامل» واستفاد من الكتابات الأكادمية والإعلامية والصناعية. فهذا النهج ذو 
فائدة «X‏ يجمع الأفكار والملاحظات سويا من مصادر متعددة وذلك من أجل تقديم نظرة 
أعم وأشمل عن المشهد المنتشرء مما يساعد على رسم وتصور الديناميكيات الأكبر» ودراسة 
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التأثيرات المحتملة لها. ومع ذلك وعلى الرغم مما سبقء فإن المنظور العام الصعب» 
والتأملي. والشامل لثورة البيانات لا يزال ضعيفا في الواقع العملي. وبدلا من US‏ فهناك 
مجموعة من الكتب وعلى وجه الخصوص (à‏ مجالات الإدارةء والأعمالء والمجالات التقنية 
تعمل بشكل كبير على دعم البيانات ولكنها تفتقر للمنظور النقدي. وعلى النقيض من 
ذلك» فال مطلوب تقارير متعددة الاختصاصات ومعقدة في تفكيرها. $9 حين أنه من المفيد 
دراسة ثورة السانات من خلال منظور متعدد الاختصاصات والأوجه» إلا ol‏ هذا المنظور 
مقيد بشكل جذرى وذلك بالنظر إلى الأجندة الشاملة والآثار ASAI‏ وعلى نحو «Uis‏ فإن 
المفهوم القائل بأن ثورة البيانات تنتج البيانات التي يمكن تفسيرها خارج سياقها أو المعارف 
خارج مجالها المخصص بحاجة إلى أن يتم إلغاؤه. ودلا من ذلك» فمن الضرورى الاستفادة 
من الأفكار واممدارك عبر الإختصاصات» حيث يعمل العلماء الذين يتمتعون بخبرات مختلفة 
ا oa‏ جل تقديم صورة أكثر شمولا (Ruppert 2012) NE‏ 
وعلاوة على ما سبقء فإن التحليلات أوجدت حاجة لي نكون حريصين ألا ننزلق إلى 
الجدليات التافهة التي إما تحدد بشكل انفعالي, حالة اليانات الكبيرةء والبانات cdo gahl‏ 
والبنى التحتية للبيانات» أو توفر TH‏ مستحكما aoo‏ أكثر نتائجها سلس فا لوقف لا 
كوت Jagal PIPP‏ أو جيدا أو سيئاء إلا فيما ندرء وعلى النحو الذى تطرحه الجدليات 
الانفعالية. وبدلا من ذلك» يتعين علينا أن نقر ob‏ التطورات الحادثة اتفاقية وارتباطية 
وسياقية. وهي تنتشر بطرق فوضوية Sual‏ تناقضية وتباينية. وكما أشرنا إلى ذلك ف 
الفصل التاسع» تعمل مجاميع البيانات في الغالب على كل من الإجبار والتحرير بشكل 
فوري ومتزامن» وأن مستهلك البيانات أحيانا يكونون هم منتجي البيانات» وأن الأنظمة 
تسعى إلى استنطاق المستخدمين بطرق عديدة. وعلى هذا النحوء فإن المجاميع غالبا ما 
تكون متشابكة ويتعين أن يتم فتحها وتفريغها بشكل حذر وذلك من أجل إظهار تدرجاتها 
الرمادية المتعددة. وعندما توجد تأثيرات تعمل بطرق مضرة وتمييزية» فنحن بحاجة إلى 
تحديد الاستجابات الاجتماعية والقانونية المناسبة التي تحمي الحقوق الفردية والجماعية 
ولكنها لا ترفض الكل لعدم رضاها عن الجزء. 
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دراسة مجاميع البيانات :(Researching Data Assemblages)‏ 
هناك ضرورة dala‏ لإجراء بحوث dus pad‏ مفصلة عن 0953 وعملء وتعزيز مجاميع 
البيانات وذلك من أجل مواكبة وتعزيز التحليلات النقدية والمفاهيمية الآعم والأشمل. ففى 
الوقت الحاليء لدينا فهم متعمق قليل بكل من البناء الإجمالي لمجاميع البيانات وأجهزتها 
وعناصرها الفردية. ونتيحة U‏ هناك Ek‏ ملحة لإجراء دراسات حاله تتتبع الترتيبات 
الفنية الاجتماعية لكافة المجاميع: مثل تجميعة بسانات لسمسار ما أو البنية ET‏ لبيانات 
بحث ماء أو حركة البيانات المفتوحة في مدينة ماء أو التوثيق المفصل ON bL‏ معينة من 
dl‏ امجاميع: مغل علم الاجتماع: والاقتصاد السياسي مطوري البرمحبات (Hackathons)‏ 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (Data Dives)‏ أو مجتمعات الممارسة 
داخل قطاع ما في البيانات الكبيرة. وبشكل نموذجيء فإن مثل هذه الدراسات ستكون 
دراسات مقارنة بطبيعتهاء تقارن التكرارات في تجميعة ماء على سبيل JELI‏ عبر الأماكن أو 
البيئات» أوعبر أنواغ امتختلفة منالتجميعة. ومن Gi‏ مثل يِحَوْت المقارنة:هنذه أن تمكن 
من تحديد العموميات والخصوصيات» وكذلك الطرق الاتفاقية والارتباطية المتنوعة التي 

تتسع من خلالها التجميعة ليتم تشكيلها 

وهناك طرق عديدة هكن من خلالها تفعيل مثل هذه البحوث» وهي تشمل تحليلا 

البيانات» كما تمت مناقشته ف الفصل السادسء وذلك من أجل تحديد تركيب تجميعة 
ما والارتباطات والعلاقات بين العناصر. وسيكون لمثل هذا النهج فوائد عديدة وذلك من 
خلال استخدام 888 التنقيب عن البيانات والتعلم JM‏ فقن Jal‏ تحديد الأنماط داخل وعر 
مجاميع كبيرة للبيانات» وكذلك من أجل تأسيس قوة نسبية للروابط. وهذا من شأنه أن 
يوفر lau) bust‏ ومقارنا للمجاميع وتشغيل هذه ال مجاميع. وعلى الرغم من ذلكء وفيما 
يتعلق بفهم السياق» والاتفاقية والارتباطية المتعلقة بتجميعة ما -التداخل المعقد للكائن 
ومحيطه - فإنه من المحتملء رها بشكل ساخرء أن مجموعة من المنهجيات الخاصة بالبيانات 
الصغيرة قد توفر bond‏ إدراکا TC‏ دقىقا. وؤتشتمل هذه «Ua‏ على سبل JULI‏ 
لا الحصرء على منهج علم الأصول (Genealogies)‏ ومنهج التفكيك (Deconstruction)‏ 
ومنهج الأعر اق والثقافات (Ethnographies)‏ ومنهج مشاركة الملاحظ Observant)‏ 
3+ وهي تمثل de gama‏ من المنهجيات التي أبدت استخدامها ق السابق 
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ف أ فهم البرامج )2011 (Kitchin and Dodge‏ والتخطيط );2009 Dodge et al.‏ 
.(Kitchin et al. 2012 a‏ وتسعى كل منهجية إلى أن تحدد — بشكل دقيق الظواهر 
الاجتماعية: وكما بينت العناصر الأحد عشرء فإن مجاميع البيانات تعتبر اجتماعية بشكل 
5 . ومن خلال استخدامها كمجموعة. فإن الإنتاج المادي sas i‏ امنتشر لمجاميع 
البيانات مكن 455525 لأغراض علمية» مما يوفر ما أطلق عليه )2013( Wang‏ مصطلح 

"البيانات الكثيفة". أي الأفكار والقصص السياقية عن البيانات وإنتاج البيانات. 


إن علم الأصول بستخدم E‏ من اخل تتبع الانتشار العرضي لنظام الأفكار أو ملجموعة 
من الأفعال عيبر الأوقات والأزمان: وذلك بدلا من إنتاج تأريخ غا سليم Crowley)‏ 
2009(. وهذا يوضح كيف أن E‏ يتن على «sou!‏ ولكنه لا يتحدد بالضرورة من 
خلاله يطرق dau‏ مسسية بسيطة. وعلى هذا النحوء يتم توظيف ele‏ الأصول من أجل 
الحل والفهم بشكل تاريخى للتكرارات الممتناقضة والمتغايرة Usa‏ وا معقدة: والمتعددة 
لآحد مجاميع «5L UI‏ أو أحد عناصرها وكذلك الفهم للانتشار المتطور والقائم للأفكار, 
والقرارات» والمعوقات, والأفعال, واللاعبين الذين أسهموا ف تطور هذه المجاميع جنبا إلى 
جنب مع النهايات المسدودة والإخفاقات الواضحة )1977 (Foucault‏ وعند فعل ذلك 
فإن هذا يحدد نقاط التجمع حيث يحتشد الناس أو الأفكار ES‏ ويتسببون i$‏ ظهور 
مجاميع جديدة: وكذلك الطرق ال معقدة والفوضوية التي تتطور من خلالها هذه المجاميع 
بعد ذلك. وف حال 8593 & البيانات» يمكن توظيف منهج ele‏ الأصول من أجل 3 تتبع تكوين 
وتطور البيانات المفتوحة والبنى التحتية للبيانات والبيانات الكبيرة بشكل أكثر عمومية, 
والتحسيد ال محدد لها. 

فعلى سبيل JÈL‏ يمكن لشخص ما أن ينتج تأصيلا مفصلا لتطور حركة البيانات المفتوحة 
بتعبيرات «dale‏ من خلال تتبع ظهور اللاعبينء والمنظماتء ونماذج التمويلء والأفكار, 
والأحداث مرور الوقت وعبر الزمن» والترابطات والتحالفات والخلافات بينهم؛ وتأثيراتهم 
على إعادة تشكيل مشهد البيانات من خلال إعادة تحديد السياسات التى تحيط بالحكومة 
التي آنتجت» واحتفظت» وكشفت Jio‏ هذه البيانات من أجل استخدامات أعم وأشمل. أو 
مكن للشخص أن يشرع في تحديد أصل كيان فردي مثل مؤسسة المعرفة المفتوحة» وهي 
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مؤسسة غير ربحية تأسست ف العام 2004 ف المملكة المتحدة: ونمت بسرعة لک تصبح 
حركة دولية مؤثرة تطالب بالبيانات المفتوحة والحكومة المفتوحة. وهناء هكن أن يسعى 
الفرد تجاه تتبع نشأة ال منظمة. وتطور مهمتها وقيمهاء وتطور البنى التحتية» والحوكمة 
والتمويلء والأنشطة: والبرامج والإصدارات» وانتشار تأثيرها وتفاعلاتها مع الهيئات الأخرى 
وهكذاء وذلك من أجل فهم الطريقة الاتفاقية والارتباطية لتوسعها وعملها على سبيل 
«JULI‏ وكذلك موقعها الحالي وسلطتها ضمن حركة البيانات المفتوحة الآعم. 

إن إجراء تحليل ele‏ الأصول عادة ما يصاحبه الاستفادة من التفكيك» وهذه الطريقة من 
التحليل تجرد وتكشف ال معاني داخل النصوص ال مفهومة بشكل واسع مثل النصوص الممكتوبة 
والصورء والخرائط والأحاديث: ومزيج من هذه الأشياء تشكل ف العادة المحتوى للكتيبات 
والمواقع الإلكترونية. فمن المفهوم أن النصوص هي الوسيط لكل من الرسائل الصريحة 
والضمنية» ومن خلال التفسير التشريحي للنص» يمكن فهم والكشف عن معان أعمق. ومن 
ناحية الجوهرء فإن التفكيك يبحث فيما يتجاوز الإشارات السطحية والقيم الاسمية لي 
يواجه القراءات المسلم بها للنص وذلك من أجل الكشف عن ا معاني المخفية بداخله» أو ربط 
امعاني المبسطة بشكل محكم )1989 (Burman and MacLure 2005; Harley‏ فالتفكيك 
هو قراءة نقدية تستخدم أساليب مثل استبدال المعاني أو القوة المحتملة: أو تحديد نقاط 
التناقض أو التباين Ja‏ حل النصية البينية والتضمين داخل الماديات والسياقات «esI‏ 
à sS Als‏ وضعة المتحدث والجمهور المستهدف له )2005 .(Burman and MacLure‏ 
وكما أشرنا إلى ذلك بالتفصيل ف الفصول الثاني والثالث والسابع» فإن البيانات المفتوحة 
الى التخفبة للنيانات CoL ciae‏ الك رة غادة ما رواكرنا حمسا dad]‏ خطابية قب کي 
إلى إقناع الناسء والشركات» والمؤسسات بمنطقها من أجل دعم وتبني والاستثمار في مبادئها 
ومنتجاتها. فالأنظمة الخطابية هذه ليست عاطمية ولكنها معقدة وفوضويةء فهي مزيج من 
المصالح المتعاونة والمتنافسة. ومن خلال استخدام التفكيك» فإن الأنظمة الخطابية لتجميعة 
ما أو duse polie‏ في هذه التجميعة. مثل الفئات العديدة في حركة البيانات المفتوحة أو 
شركات معينة تعمل على تعزيز حلول البيانات الكبيرة على القضايا المدنية» يممكن تجريدها 
وتفكيك رسالتها وتكوينهاء مما يكشف عن معاني» والأيدولوجيات (المعتقدات): والسلطات 
الكامنة داخل تصميمها وعرضها. 


ثورة البيانات البيانات الكبيرة: والبيانات ا مفتوحة. والبنى Jl‏ لتحتىة للسانات» والنتائج ا مترتية عنها ۳۹ 
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وتوفر دراسات الأعراق والثقافات تحليلات شاملة وهائلة لمجتمعات الممارسة من 
خلال التوثيق التفصيلي لتنظيمهاء وعملهاء وثقافتهاء وقواها المحركة الداخلية وارتباطاتها 
الخارجية )2000 (Herbert‏ وعلى نحو نموذجيء يوظف ال منهج الإثنوغرافي (وصف 
الأعراق والثقافات) مزيجا من مراقبة المشاركين التي يتم القيام بها عبر فترة زمنية ممتدة, 
ومقابلات شخصيه متعمقة مع مجموعة كبيرة من ال مستفيدين الداخليين والخارجيين» مع 
تعزيز كل ما سبق بأساليب أخرى مثل القراءات التفسيرية للوثائق والأدوات ذات الصلة 
مثل المواقع الإلكترونيةء وتبادلات البريد الإلكترون» وأماكن العمل... إلخ. ومن الناحية 
الجوهرية. يسعى ee‏ دراسة الأعراق والثقافات إلى الفهم الدقيق للعام الحياق ممجتمع 
ما - علاقاته dae ze VI‏ وايقاعاته ال متواترةء dileag‏ الثقافية: وأنماط السلطة:. واتخاذ 
القرار 4,3« وطرق كينونته.... إلخ - من Jal‏ فهم كيف تشكل هذا لمجتمع وكيف دنمو 
بشكل مستمر )2007 .(Crang and Cook‏ ويذهب الباحث 1 فته اذا تقديم 
وصف سطحي لتوثيق الطرق ال معقدة التي تعمل من خلالها المجتمعات من خلال كونها 
متضمنة داخل العلاقات والممارسات التي يتم دراستها. ومن شأن دراسة الأعراق والثقافات 
مجاميع البيانات أن تق بعد ذلك أوصافا تفصيلية lal‏ عن كيف تم تكوينها وكيف 
تعمل على أرض الواقع. فعلى سبيل JELI‏ فإن دراسة الأعراق والثقافات ممؤسسة ال معرفة 
المفتوحة سوف تتكون من باحث تم تضمينه داخل تلك المنظمة»ء وهو يشارك في التخطيط 
للاجتماعات» والأنشطة. والفعاليات» ويراقب تفاعلات العمال ويجرى مقابلات شخصية 
مع المستفيدين الأساسيين للحصول على مدارك مباشرة حول عمليات اللاعبون الأساسيون 
في حركة البيانات المفتوحةء وكيف يتم تأسيس وإدارة المكونات العديدة للجاميع البيانات 
(بمعنى أنظمة الأفكار؛ والاقتصاد السياسي؛ وأنماط الحاكمية؛ واطماديات؛ والبنى التحتية؛ 
إلخ) داخلها وعبرها. وعلى نحو مشابه: يمكن للفرد أن يجري دراسة الأعراق والثقافات 
داخل بنية تحتية معينة للبيانات: أو على سمسار للبيانات» أو داخل شركة للبيانات SII‏ 
أو داخل elgi‏ معينة من الفعاليات مثل سباقات البرمجة أو المعارض وامؤتمرات الصناعية 
أو فرق البيانات الكبيرة داخل الحملات الانتخابية... إلخ. 

ويمكن أن يتم دعم مثل هذه الدارسات للأعراق والثقافات من خلال مشاركة 
daz MU‏ وهذا نوع من الدراسة الذاتية للأعراق والثقافات حيث يجري الباحث 
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دراسة مستدهة لارتباطاتهم وارتباطات الناس الآخرين بظاهرة أو ممارسة ما 
.(Crang and Cook 2007; Morton 2005)‏ وفيما يتعلق بثورة السانات: من 
الممكن أن يتم مشاركة الملاحظين بحيث يكونون جزءا من فريق يبني البنى التحتية 
للبيانات» أو يكونون أعضاءً في حركة البيانات المفتوحة» أو يعملون كعلماء للبيانات 
يوطفون BLUT‏ الكبيزة :من أجل معالجة"قضية معينة:.. EIM AEE PO‏ 
النهج يعتبر في الأصل تمرينا للانعكاس الذاتي» وهو تدريب شخصي وغير موضوعي» 
cu‏ يسعى الباحث lialo‏ وبدقة بالغة لدراسة ممارساته وممارسات الاخرين 
à‏ کال ا چیک كبرق Lo‏ أساسيا في هذا المجالء فالفائدة الأساسية J&b‏ هذا 
ا منهج تتمثل في أن الباحث يدرك بشكل كامل ال مشهد المتنوع والمعقد من النواحي 
الاجتماعية. والسياسية» والاقتصادية والذي يعمل من خلاله هذا الباحث ويعتبر 
أحد المشاركين الفاعلين فيه ويتعرض للعمليات المتعددة الجارية. ويظل الانتقاد 
الأساسي الموجه لمثل هذا المنهج هو أنه من الممكن بدرجة كبيرة أن ينثني الباحث 
ويوضع في مكان ما بشكل شخصيء مما يفقده التمثيل العريضء ورها تتم الاستفادة 
من هذا المنهج بشكل أمثل إذا ما تم دمجه مع طرق أخرى توفر سياقا أعم وأشمل. 
إن هذه الطرق تمثل مجموعة dijo‏ من مجموعة من الطرق ال محتملهة لفهم مجاميع 
البيانات وعناصر هذه المجاميع» ومما لا شك فيه أن الكثير من هذه المناهج سوف يتم 
توظيفها من أجل إجراء بحوث تجريبية على طبيعة ثورة البيانات المنتشرة: إذ يوفر كل 
منهج رؤى مختلفة. وفي الواقع. فإن ا منهج الذي يستخدم طرقا مختلطة تمزج بين الرؤى 
السياقية المتعمقة للدراسات النوعية التي تستهدف البيانات الصغيرة وبين الدارسات الأعم 
JI‏ | توظف تحليلات البيانات رها يكون بدنلا Twy‏ لاتباعه. وق مثل هذه الدراسة» 
من الممكن استخدام تحليلات البيانات من أجل تقديم منظور شامل لمجاميع البيانات» أو 
الروابط أو التداخلات بين المجاميع: والتي يتم اتباعها بعد ذلك من خلال البحوث الأكثر 
تركيزا باستخدام الطرق التي تم تفصيلها من أجل توفير رؤى متعمقة للعلاقات والعمليات 
السارية ذاخل وبين هذه الغناضر. أو من الممكن أن يكون هذا المزيج مزيجا كميا صرفا 
فيما يتعلق بالصيغةء وذلك على النحو الذي تمت الإشارة إليه بالتفصيل ف المناقشات بشأن 
علم البيانات في الفصل الثامن» حيث تم تبني التحليل التفسيري لتجميعة البيانات بشكل 
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أكبر من اختبار الفرضيات التقليدي من أجل تحديد أكثر العناصر الفاعلة ظهورا. ويمكن 
أن يعمل هذا المنهج أيضا بشكل عكسي» حيث يتم استخدام البحوث المتعمقة المركزة من 
أجل توجيه انتشار تحليلات البيانات عبر عينة أكبر بكثير. وفي كلتا الحالتين» فإن المرحلتين 
الأولى والثانية تعملان بتناغم بعضهما | مع بعض من أجل تعزيز المدارك والمعارف. ففي 
الحالة الأولى» يتم استخدام الصورة الأعم من أجل المساعدة في صياغة الفهم وتعميقه وقرنه 
بالسياقء أما في الحالة الثانيةء فإن الفهم المتعمق يوفر الأساس محاولة تأسيس أو وضع 
تفسير أعم وأشمل. 


أفكار ختامىة: 

لا تزال ثورة البيانات في طورها التمهيديء ولكنها تنتشر بسرعة بالغة. فخلال عدد 
من السنوات لا يتجاؤز أصابع اليد الواحدة: كان للبيانات المفتوحة والبيانات الكبيرة 
والبنى التحتية للبيانات تأثيرات كبيرة على مشهد البيانات» وتزامن هذا مع مناقشات 
صوتية حماسية تعلن عن التأثيرات الإيجابية الخطيرة لها. إن سرعة التطورات التي تحدث 
تعني أن التحليل النقدي الموسع:؛ والمتعمق» وا لمدروس يجد صعوبة بالغة في مواكبة تلك 
التطورات. ومما لا شك فيه أنه خلال السنوات القليلة القادمة سيكون هناك فيضان 
حقيقي من مثل هذه الدراسات التي تسعى إلى توثيق طبيعة وآثار مجاميع البيانات 
الناشئة. وكما ادعى البعض خلال هذا haill‏ فهناك حاجة ملحة لهذه الدراسات. إن 
هذا العمل سوف يحدد من جانب الطرق ال مناسبة لفهم ثورة البيانات» من خلال كل 
من التفكير المفاهيمي والدراسات النقدية. وعلى الجانب الآخرء سيوفر بيئة لتفكير أكثر 
معيارية فيما يتعلق بكيفية تطور وتنظيم وإدارة مشهد البيانات. وق الوقت «ol JI‏ فإن 
الأخير يكون ف الغالب تفاعلياء ومفهومًا بشكل ضعيفء وتسيطر عليه المصالح المكتسبة. 
لقد سعى هذا الكتاب إلى تقديم تحليل أولي ومفاهيمي بشكل متوازن» ونقدي وشامل 
والذي من الممكن أن يساعد على توجيه الدارسات التي تتبعه. ولوقت طويل للغاية 
فإن البيانات وتكوين وعمل المجاميع التي تحيط بالبيانات قد تم الأخذ بها على أنها أمور 
مسلم بهاء في حين أن الاهتمام كان Lara‏ على المعلومات والمعارف المستقاة منهاء فالوقت 
قد حان لتدارك هذا الإهمال. 
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المترجم في سطور 


د. محمد بن أحمد علي غروي 
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أبرز الأنشطة العملية: 

.١‏ عضو اللجنة الرئيسية لمبادرة البرنامج الوطني للتدريب عن «iso‏ ١٠١۲م‏ - الآن. 

۲. عضو الفريق الوطني لبناء إطار حوكمة التعليم والتدريب الإلكتروني بالمملكة العربية 
السعودية: AVANT‏ 

.Y‏ عضو الفريق الدولي لدراسة احتياج المهارات الوظيفية» صندوق الموارد البشريه بالتعاون 
مع جامعة Y: W-Y* VO ojla‏ 

-Y V0 عضو الفريق الوطني لقياس التحول للتعاملات الحكومية الإلكترونية (قياس)‎ .٤ 
l الان.‎ 

0. عضو الفريق الدولى لجائزة الإنجاز قي التعاملات الحكومية الإلكترونية (إنجاز) 6١١٠م.‏ 

1. عضو الجمعية الدولية. للحكومة الرقمية ٠١١١ (DG.O)‏ - الآن. 

لا. مدير مشروع إثراء وتنويع مصادر المعرفة العربية ١٠١۲-الآن؛‏ معهد الإدارة العامة 
الرياض. 

۸. مشرف على برنامج التدريب الإلكترونى ۱۲١۲ح‏ -٤٠١۲م؛‏ معهد الإدارة العامة الرياض. 

.٩‏ باحث ومدير برامج 9١٠٠م te V VV‏ مركز أبحاث التقنية الحكومية» 355555« الولايات 
المتحدة الأمريكية. 

AY W- تنفيذ عدد من الاستشارات للجهات الحكومية با مملكة العربية السعودية ۲۰۰۱م‎ .٠ 

Y * W-eY* \ تصميم وتطوير العديد من البرامج التدريبية في مجال تقنية المعلومات‎ . VY 

۲. المشاركة ف العديد من المحافل والمؤتمرات المحلية والإقليمية والدولية. 
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مراجع الترجمة في سطور 


د. ماجد بن عبدالعزيز البريان 
- الدكتوراة في مجال أنظمة المعلومات والتخطيط الإستراتيجي للمنشآتء جامعة سالفورد 
بريطاننا (Y)‏ 


الوظيفة الحالية: 
- أستاذ مساعد بقسم نظم المعلومات - كلية علوم الحاسب وال معلومات - جامعة الإمام 


الخبرات العلمية والعملية: 

- عمل عضو هيئة تدريس بقسم تقنية المعلومات والاتصالات بكلية ال ملك فهد الأمنية. 

- عمل محاضرا غير متفرغ مركز خدمة المجتمع بجامعة الإمام محمد بن سعود. 

- الإشراف ومناقشة عدد من رسائل ال ماحستير. 

- حضور ونشر عدد من المشاركات العلميه بعدد من المؤتمرات والمجلات العالية. 

- عمل مستشارا بهيئة الهلال الأحمر السعوديء ۲۰۱۷ - حتى الآن. 

- عضو فرق عمل ضمان الجودة لشركه QSR-International‏ فيما بخص ضمان 63927 
واختبار برمجياتها (NVivo)‏ تطبيق إدارة وتحليل البيانات الوصفية. 

- العمل مستشار لأمانة مدينة الرياض ف تطوير مشروع مركز الاتصال ٠٤١‏ . 

- العمل مع إدارة تقنية المعلومات بالمؤسسة العامة للتقاعد على تحليل بعض ال مشاكل 
„AI‏ 

- العمل على تطوير أنظمة حاسوبية لشركة القصبي. 

- العمل والإشراف على تطوير عدة أنظمة حاسوبية تطبيقية بكلية الملك فهد الأمنية. 
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- القيام بدراسة تقييم تطبيقات أنظمة المعلومات من حيث النجاح والفشل ومن بينها 
نظام الإسعاف مدينه لندن وكارثة (LASDS)‏ عام e VARY‏ 

- دراسة تحليلية لتطبيق نظام ERP‏ لإدارة عمل جمعية الهلال الأحمر التركية (TRCS)‏ 

- القيام بإعداد دورة تدريبية خاصة لطلبة الدكتوراة 3( قسم IRIS‏ بجامعة سالفورد فيما 
بخص العمل على نظام التحليل الوصفي للبيانات NVivo‏ 

- القيام بإعداد دورة تدريبية خاصة لطلبة الدكتوراة في قسم IRIS‏ بجامعة سالفورد فيما 
يخص العمل على نظام الفهرسة الإلكترونيه EndNote‏ 
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حقوق الطبع والنشر محفوظة لمعهد الإدارة العامة ولا يجوز 
اقتباس جزء من هذا الكتاب أو إعادة طبعه بأية صورة دون موافقة 


كتاسبة من المعهد الا في حالات الاقشاس القصبر بغرض النقد 
والتحليل» مع وجوب ذكر المصدر. 





تم التصميم والإخراج الفني والطباعة في 


هدا الكتاب 

بهدف كتاب ثورة الببانات إل تقدم ى بن مجدتتق ود قيق للبياتات وثورة البيانات LIL à.‏ 
فالكتاب يسعى. من جهة, لببن سس ,لسري و الوس نل المتعلقة بإعادة تشكيل إنتاج ومعالجة 
وخلبل وتبادل البيانات, وما pir‏ هذا لكيفية إنتاج واستخدام المعلومات والمعرفة: وهو. من 
جهة أخرى. مهد للنقاش والثفكبر التقدى حول الببانات من حبث طبيعتها. وكبفبة تأطبرها 

من النواحى القنبة والفلسفية والأخلاقبة والاقتصادبة والتجمبعات التقتية والمؤسسبة 
å husi‏ بها وبستند التحليل المقدم فى هذا الكتاب إلى مشاركة واسعة النطاق وإلى ما 
سبقه من مؤلفات في مختلف العلوم. والعلوم الإنسانية, والعلوم الاجتماعبة. ومن مطبوعات 
الثقافة الشعبية, والاصدارات الصحافية. والدوربات الصناعية؛ والى خبرة مباشرة فى العمل 
dsl. mr‏ حفظ áis PT TO FER‏ ومشاريع SVUL SLLLS‏ على نطاق مؤسسسي ls‏ 
وبنقسم الكتاب الى أحد غشر pais Slad‏ الفصل الأول iole åd‏ ونقذا L Sà‏ حول مقهوم 
السانات وكبفبة فهم قواعد السانات والبنى التحتبة للسانات, قى حبن ببحث الفصل الثاني قي 
الدورالمستمرلليبانات الصعبرة والكيفبة التي تم بها توسيع تطاقها إلى أرشيفات/محفوظات ٠‏ ,ر 
رقمبة وبنى ختبة, الى أن وصلت إلى درجة التداول وببعها من خلال وسطاء الببانات. كما بناقش” » ب - 
القصل الثالث الداقع للتوجة تحو استحداث السانات المفتوحة والببانات المرتنطة >t ^. -Dh‏ 
التي يجري تقاسمها ومشاركتها وإعادة استخدامها على تطاق أوسع 1 


مرور الوقت. وببتن القصلان الرابع والخامس igal‏ البباتات الكبيرة Ir d‏ 
بالتفصمل وعوامل التمكين للسانات الكسبرة ومصادرها ^ rem‏ كب 
الساعدة على انتشارها. paisg‏ الفصل السادس åg‏ | 8ء C Rr‏ 
غامة عن مجموعة جديذة من خلبلات الببانات ا : ns‏ 
التى ترمس الى فهم البيبانات الصغيرة الموسعه VU ْ ١‏ < 2م d‏ - 
والببانات الكبيرة. كما بدرس الفصلان السابع. / SND P‏ 

Ard £e f اا — برع"‎ , 
"a E | * ^ ; ' , V. 1 uu الد تخدمة‎ ro! galla 
A , CIT wa 5 الكبيرة والترويج لها وبيان تأثبرها فقي‎ 
i-e 9 Lema tan spis الحوكمة والأعمال. والسبل التى‎ 
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المزند من المسحت والتاصبيل 


تسم rs‏ وخلياغة الإدارة العامة للتشماعهه uilla‏ 7-4 1 
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